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Abstract 


In the fast-changing world of science and technology. Appeared 
information appliances, handheld and wireless devices. There are many 
hardware and software design changes taking place. Many devices now feature 
32-bit microprocessors from Intel, MIPS and Motorola, as well as larger LCD 
graphical displays. In order to leverage the significant results gained in the last 
ten years, many developers are turning to using friendly user interface 
operating systems with these new embedded designs. 

One of the most promising emerging areas seems to be running Linux in 
these environments, for a couple of good reasons: Linux on embedded systems 
brings with it the entire power of desktop computing, along with many 
solutions already running. Linux, being open source, allows any aspect of the 
solution to be fully understood and then customized for a particular application. 
Linux also supports all the new microprocessors typically included in 
embedded designs, including StrongARM, MIPS and PowerPC. Finally, Linux 
is free, with no royalty payments required for its use. So using Linux as 
operating system , with a GUI system built on, seems to be a good solution. 

For the handled devices on the market such as PDA, as to the poor 
hardware in old days, the function was very simple; we could hardly see the 
GUI and network support. But recently we found that some embedded 
operating systems such as Windows CE and Palm OS, have supported complete 
GUI features. With the great performance improvement of the hardware, we 
think that the need for embedded OS is urgent. 

I got interest with Linux operating system several years ago. 
Combination my specialty, Then I did some research for real-time Linux. 
Based on these facts, this thesis demonstrates architecture and internals of 
Linux system used on embedded systems. 

At first, the thesis outlines the history of embedded systems and real-time 
systems. Chapter 2 describes related research in area of real-time Linux 
systems. Chapter 3 details the design and implementation of real-time Linux. 
Chapter 4 contain a discussion of the application model of real-time Linux. The 
measurements results of real-time Linux performance can be found in Chapter 
5. The last chapter gives some conclusion and foresight. 
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幅 入 式 系统 的 出 现 至 今 已 经 有 30 多 年 的 历史 了 ,嵌入 式 技 术 也 历经 了 
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效率 较 低 ， 存 储 容量 
于 这 种 嵌入 式 系统 使 用 简便 、 价 格 很 低 ， 
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用 户 界面 不 够 友好 ; 系统 主要 用 来 控制 系统 负载 以 及 监控 应 
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Internet 为 标志 的 代 入 式 系统 ， 这 是 一 个 正在 迅速 
发 展 的 阶段 。 目 前 大 多 数 租 入 式 系 统 还 孤立 于 Internet 之 外 ， 但 随 着 
Internet 的 发 展 以 及 Internet 技术 与 信息 
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VE. 相关 支 撑 人 硬件 包括 显示 卡 、 
IC 卡 或 信用 卡 的 读 取 设 备 等 。 远 入 式 系统 有 别 于 一 般 的 计算 机 处 理 系 统 ， 
它 不 具备 像 便 盘 那 样 大 容量 的 存储 介质 ， 而 大 多 使 





作为 存储 介质 。 奶 入 式 软件 
界面 、 通 讯 协议 、 数 据 库 系 统 、 
总 体 看 来 ， 嵌 入 式 系统 
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和 颈 入 式 系统 具有 不 可 修改 性 、 系 统 所 需 配 置 要 求 较 
性 较 强 等 特点 
后 PC 时 
系统 就 是 与 这 一 时 代 紧 密 术 
一 个 人 机 和 1 
于 人 类 工作 与 生活 的 各 个 领域 ， 
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氏 、 系 统 专业 性 和 实时 


代 是 一 个 真实 的 阶段 ， 而 且 是 一 个 可 以 预测 的 时 代 。 构 入 式 
它 将 拉 近 人 与 计算 机 的 距离 ， 形 成 
小 的 工作 与 生活 环境 。 从 某 一 个 角度 来 看 ， 肉 入 式 系统 可 应 
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(É AR LS | CARR AUER TE REDE LI, ER 4 大 操作 系统 
阵营 WinCE[18], Palm OS[19]、EPOC[20] 和 Linux[21] 展 开 规格 战 ， 各 拥 
有 软件 及 硬件 合作 厂商 逐鹿 信息 家 电 市 场 的 份额 。 

全 球 手持 式 信息 家 电 快 速 增长 ， 据 预测 ，2000 年 至 2004 年 市 场 增长 
率 将 到 达 77.4%， 个 人 数字 助理 器 (PDA) 、 智 慧 型 手机 等 手持 式 信息 家 
电 操 作 系 统 竞争 日 益 激 烈 。 除 了 为 后 个 人 电脑 时 代 的 硬件 大 厂 带 来 新 一 轮 
商机 外 ， 应 用 软件 厂商 包括 电子 字典 、 电 子 地 图 、 游 戏 开 发 业者 的 商机 也 
大 量 涌现 。 

微软 窗口 操作 系统 拥有 在 个 人 电脑 上 的 操作 系统 占有 率 的 优势 ， 使 

WinCE 拥有 强大 的 窗口 资源 支援。 不 过 Palm OS 操作 系统 拥有 全 球 PDA 
产品 70% 的 市 场 占 有 率 ; 同时 获得 3COM、IBM 和 索尼 等 跨国 公司 的 支持 。 
EPOC 是 发 展 自 欧 洲 的 操作 系统 、 是 由 世界 上 最 大 的 3 家 移动 电话 厂商 诺 
基 亚 、 爱 立信 和 摩托 罗拉 所 共同 开发 、 整 合 组 成 新 公司 ， 开 发 出 来 的 新 操 
VERH; 在 3 大 电话 厂商 的 合作 下 ，EPOC 市 场 潜 力 很 大 ， 且 占有 率 高 ， 
但 应 用 功能 以 手机 为 主 ， 目 前 并 不 开放 授权 。 
此 外 ， 在 3 大 主流 操作 系统 品牌 外 ，Linux 也 将 是 今后 一 股 强劲 的 力 
量 ， 由 于 Linux 开放 源码 ， 经 过 这 些 年 的 发 展 ， 已 经 成 为 一 个 健壮 的 可 靠 
的 高 性 能 的 操作 系统 。 愈 来 愈 多 的 代入 式 系统 设计 员 发 现 Linux 可 以 成 为 
= N^ F CN SNR E KH. M Linux 的 最 大 的 优势 还 在 于 它 是 一 个 开放 
的 操作 系统 。 由 于 Linux 开放 源码 ， 操 作 系 统 的 一 切 对 用 户 都 是 透明 的 ， 
用 户 可 以 最 大 限度 地 控制 系统 开发 的 进度 和 造价 。 在 开发 过 程 中 遇 到 的 各 
种 各 样 的 硬件 设备 ， 可 以 方便 地 在 网 上 找到 这 些 设 备 的 驱动 程序 ， 得 到 支 
FE. Linux 内 置 网 络 支 持 ， 用 户 可 以 轻松 地 使 自己 的 谍 入 式 具 有 网 络 功能 。 
Linux 是 模块 化 的 操作 系统 ， 提 供 了 优秀 的 可 缩放 功能 ， 用 户 可 以 方便 地 
删除 不 需要 的 模块 ， 大 多 数 嵌 入 式 系统 对 操作 系统 的 体积 非常 敏感 ，Linux 
的 可 以 根据 自己 的 需要 ， 选 择 特定 的 功能 模块 ， 自 主 地 搭建 谱 入 式 操作 系 
Zt. Linux 支持 绝 大 多 数 CPU, ff Intel, MIPS, ASIC, ALPHA, 68K, 
POWER PC 等 。 这 使 Linux 几乎 可 以 租 入 到 各 种 人 硬件 设备 上 。 成 为 各 家 三 
商 极 力 发 展 的 操作 系统 ， 加 上 其 核心 小 ， 洪 力 可 观 。 
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1.2 实时 系统 概况 






























































1.2.1 什么 是 实时 系统 
实时 计算 正在 成 为 越 来 越 重 要 的 原则 。 操 作 系 统 ， 
可 能 是 实时 系统 中 最 重要 的 组 件 。 实 时 系统 的 例子 包括 实验 控制 、 过 程 
制 设备 、 机 器 人 、 空 中 交通 管制 、 远 和 
代 系 统 还 将 包括 自动 驾驶 汽车 、 具 有 弹性 关节 的 机 器 人 
产 中 的 系统 控制 、 空 间 站 和 海底 勘探 等 。 






































空 制 器 、 


村 别 是 调度 程序 ， 




















Hs 
"BC. his Lues, F 
智能 化 生 


实时 计算 [5] 可 以 定义 成 这 样 一 类 计算 ， 即 系统 的 正确 性 不 仅 取 决 于 计 
算 的 逻辑 结果 ， 而 且 还 依赖 于 产生 绪 果 的 时 间 。 我 们 可 以 通过 定义 实时 进 








程 或 实时 任务 来 定义 实时 系统 。 一 般 说 来 ， 在 实时 系统 中 ， 





























INES, “EMMA 











件 ， 或 者 对 事件 做 出 反应 。 由 于 这 些 事件 是 “实时 ”发 生 的 ， 
务必 须 能 够 跟 得 上 它 所 关心 的 事件 。 因 此 ， 


有 


定 的 紧急 程度 。 


























某 些 任务 是 实 


这 类 任务 试图 控制 外 部 世界 发 生 的 事 





























BR FS BR f 









































个 最 后 期 限 ， 最 后 
务 或 软 任务 两 类 。 





期 限 指定 开始 时 间或 结束 
一 个 便 实 时 任务 Chard real-time task) 指 必须 满足 最 后 
1， 和 否则 会 给 系统 带 来 不 希望 的 破坏 或 者 致命 的 错误 。 一 个 软 实时 
{£4 (soft real-time task) 也 是 一 个 与 之 关联 的 最 后 
个 期 限 的 要 求 ， 但 这 并 不 是 强制 的 ， 
个 任务 仍然 是 有 意义 的 。 实 时 任务 的 男 一 个 特征 是 它 
的 。 一 个 非 周 期 任务 (aperiodic task) 有 个 必须 结束 或 



































其 








即使 超过 了 最 后 








BR, 1 








门 是 周期 还 是 非 周 











因而 实时 任 
通常 给 一 个 特定 的 任务 制定 一 
对 间 。 这 类 任务 可 以 分 为 硬 任 








期 














限 ， 并 希望 能 满足 这 
周 度 和 完成 这 




















其 




















台 的 最 后 期 限 ， 





或 者 有 一 个 关于 开始 时 间 和 结束 时 间 的 约束 。 而 对 于 周期 任务 (periodic 

















task)， 这 个 要 求 





述 成 “每 隔 周 





























1.2.2 实时 操作 系统 的 特点 


实时 操作 系统 一 般 符 合 以 下 的 























O 可 确定 性 : 是 指 它 可 以 按照 固 
行 操作 。 


O 啊 应 性 : 是 指 在 系统 得 到 中 断后 系统 为 
o 用 户 控制 :是 指 允 许 有 









































期 工 一 次 ”或 者 “每 隔 工 个 单位 ”。 























些 要 求 [5]: 
定 的 、 预 先 确 定 的 时 间或 时 间 间 隔 执 
re BE HR H HY BY Ïe] o 





























级 、 任 务 权限 等 )。 


@ 可 靠 性 
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HP age Rr 























ES RESTE (L VÈ St 





e 故障 弱化 运行 : 是 


Zb, 
He o 





指 系统 在 故 隐 时 尽 可 能 多 地 保存 其 权能 和 数据 的 





嵌入 式 系统 一 般 都 是 实时 系统 ， 实 时 系统 大 都 是 用 在 嵌入 式 环 境 。 用 








DIE A DARA EE "e 
因为 广泛 应 用 于 现实 世界 


























要 一 个 支持 实时 多 























Ho RTOS Kai A do 
增加 的 今天 ， 如 果实 时 应 
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用 软件 开发 还 是 没有 基于 一 个 完善 的 RTOS, 


于 嵌入 式 场 合 的 实时 操作 系统 就 是 嵌入 式 实 时 操作 系统 。 在 一 个 较为 完善 
王 务 的 操作 系统 (RTOS) 内 核 ， 
的 嵌入 式 设 备 必 须 具 有 与 外 部 环境 实时 交互 的 能 
用 复杂 化 直接 相关 的 ， 在 应 用 需求 的 复杂 度 不 断 














As 





么 无 法 将 系统 软件 和 应 用 软件 分 离 ， 开 发 周期 过 长 、 成 本 过 高 。 因 此 ， 








大 








此 RTOS 是 实时 应 用 软件 开发 的 必然 产物 。 





第 二 章 ” 实 时 系统 的 相关 研究 


尽管 现在 的 操作 系统 变 得 种 类 繁多 ， 但 是 UNIX 及 其 兼容 的 系统 仍然 
工业 和 学 术 领 域 标准 的 操作 系统 ,一 些 非 UNIX 系统 , 比如 Windows NT, 
是 与 POSIX.1003 标准 兼容 ,这 个 标准 无 疑 是 基于 UNIX。 这 个 系统 的 成 
是 由 于 它 的 开放 性 、 稳 定性 和 事实 的 标准 。 随 着 POSIX1003.1b 实时 扩 - 
展 标 准 的 发 布 , UNIX 有 机 会 成 为 分 布 最 广泛 的 实时 处 理 平台 。Linux 作为 
一 个 类 UNIX 的 系统 ， 凭 借 其 开放 源码 的 优势 ， 获 得 越 来 越 广泛 的 应 用 。 

由 于 以 上 的 原因 ， 在 这 一 章 我 将 集中 讨论 与 Linux 相关 的 实时 系统 。 
我 将 讨论 在 Linux 上 进行 实时 运算 的 问题 ， 和 在 一 些 系 统 中 如 何 解 决 这 些 


问题 。 


















































Y E en 








































































































2.1 LINUX 的 分 时 特性 


UNIX 最 初 是 作为 一 个 分 时 系统 设计 的 [17]。LINUX 作为 UNIX Ij và 
你 ， 很 多 当前 的 实现 中 仍然 保留 了 这 些 特 点 。 它 们 力争 最 优 的 平均 性 能 。 
这 个 目标 通常 与 实时 系统 的 低 延迟 和 高 可 预言 的 要 求 相 勃 的。 为 了 说 明 这 
个 问题 ， 让 我 们 考虑 一 个 通过 扬声器 发 声 的 程序 (程序 2.1)。 



































#define DELAY 10000 
main() 


{ 





alia Lp 
while (1) { 
for (i=0; i<DELAY; i++) 
speaker on(); 
for (i20;i«DELAY;i--) 
speaker off(); 





程序 2.1 简单 的 发 声 程序 








扬声器 的 驱动 程序 假定 为 具有 两 种 状态 on 或 off。 初 看 起 来 这 个 程序 
可 以 按 给 定 的 周期 输出 方 波 ， 使 扬声器 正常 的 发 声 。 然 而 ， 当 运行 一 个 标 
准 的 LINUX 程序 时 ， 它 将 不 能 正确 的 发 声 。 

我 在 一 个 有 412MHz Celeron 处 理 器 的 Linux 操作 系统 上 运行 这 个 程 
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序 。 当 在 系统 没有 别 的 程序 在 运行 时 ， 扬 声 嚣 发 出 稳定 的 声音 。 每 一 个 滴 
答 声 都 可 以 听 到 。 当 有 按键 动作 或 者 移动 鼠标 时 ， 都 会 引起 声音 的 断 续 。 

















在 执行 磁盘 操作 或 高 运算 量 的 程序 时 ， 声 音 将 变 得 严 习 
一 个 大 的 程序 , 比如 X-Windows, 扬声器 将 持续 大 约 




















失真 。 最 后 ， 起 动 





EF 秒 的 时 间 不 能 发 声 。 


假如 这 个 程序 是 控制 步 进 电机 的 ， 而 不 是 使 扬声器 发 声 ， 那 么 程序 将 不 能 

















使 电机 稳定 地 运行 。 
Linux 的 设计 也 





0 实现 的 原理 大 体 - 








上 与 UNIX 是 相同 的 [12]。 它 们 都 是 采 





用 分 时 的 调度 ， 低 的 计时 分 辨 率 ， 非 占 先 式 内 核 ， 关 中 断 和 虚拟 内 存 。 我 
们 在 细节 上 来 考虑 这 些 问题 。 


























调度 程序 是 内 建 在 操作 系统 内 部 的 一 组 集 


作 将 由 计算 机 来 完成 [和 4]。 


大 部 分 的 UNIX 操作 系统 ， 尤 
追求 的 是 平均 响应 时 间 、 奉 吐 量 和 在 进程 之 间 的 公平 的 CPU 时 间 分 配 [16]。 





























其 是 Linux 


站， 它 决 定 哪 一 项 工 





操作 系统 ， 它 们 的 调度 程序 





每 个 进程 的 优先 级 是 动态 的 基于 进程 已 经 花费 的 CPU 时 间 ， 输 入 /输出 强 
度 和 别 的 一 些 因素 来 决定 。 


Linux 系统 使 











用 














国定 的 时 间 片 (tme slices) 来 调度 CPU 时 间 。 最 开始 进 


程 赋予 一 个 高 的 优先 级 。 如 果 在 茶 个 进程 的 时 间 片 内 , 这 个 进程 放弃 CPU, 


它 的 优先 级 将 不 会 变 ， 或 者 变 的 更 高 。 为 一 方 再 
的 时 间 片 ， 它 的 优先 级 将 会 变 低 。 这 利 











编辑 器 ， 由 于 这 类 程序 更 多 的 把 时 间 花 费 在 

































































， 如 果 一 个 进程 使 用 完 它 
策略 关心 的 是 交互 式 程序 ， 比 如 说 
VO 输入 输出 的 完成 。 虽 


然 对 在 终端 前 的 用 户 来 说 是 有 利 的 。 由 于 程序 的 执行 完全 依赖 于 复杂 的 、 




















不 可 预知 的 系统 负荷 与 别 的 进程 的 活动 ， 这 种 调度 方式 对 于 实时 进程 而 言 


完全 没有 用 。 








Linux 中 加 进 了 POSIX 实时 扩展 部 分 ， 


























引进 了 实时 进程 的 概念 ， 人 允许 














个 进程 定义 为 一 个 实时 进程 。Linux 区 分 实时 进程 和 普通 进程 ， 采 用 不 
同 的 调度 策略 。 即 先 来 先 服务 调度 (SCHED_FIFO) 和 时 间 片 轮转 调度 
(SCHED_RR)。 在 SCHED RR 调度 中 , 任务 一 旦 时 间 片 用 完 就 被 移动 到 优 





KAA, HA 
有 其 它 任务 ， 该 任务 继续 运行 下 一 个 时 | 
塞 的 策略 。SCHED_FIFO 任务 按 优先 级 调 
或 阻塞 在 某 种 资源 上 。 不 像 SCHED_RR {£43 

另外 还 有 计时 器 的 精度 问题 。 
















































































F 同 一 优先 级 的 其 它 任务 运行 。 如 果 同 一 优先 级 没 
HH. SCHED FIFO 是 运行 直至 阻 
E, 一 旦 开始 就 一 直 运 行 到 结束 


























BEH E AD PH S o 
以 前 提供 给 用 户 进程 警报 信号 和 sleepO 











系统 调用 只 有 1 秒 的 精度 ， 如 此 粗糙 的 计时 精度 是 不 适合 大 多 数 的 实时 进 
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程 。 当 前 的 版 本 提供 了 更 高 精度 的 时 间 间 


了 计时 



































NË 


BIER 
大 部 分 的 Linux 的 核心 进程 
进程 进 
在 这 期 间 有 一 个 更 高 优先 级 的 实时 





p 

















性 。 这 方面 的 内 容 在 后 面 将 

















| 核心 模式 ， 它 将 运行 对 



































于 不 需要 考虑 内 核 习 
然而 ， 一 个 系统 调 














HH 





的 延迟 是 不 能 接受 的 。 


H tA 
响应 的 一 个 折 中 。 这 种 方法 还 是 不 能 


在 运行 部 分 


方式 在 分 时 系统 中 将 很 好 的 运行 
起 的 系统 不 可 看 


测试 的 内 容 包 括 


于 非 占 先 式 内 核 术 
步 的 操作 ， 比 方 说 中 出 
"en 























Linux 





AH 


为 了 对 Linux 的 性 能 


HE 















































系统 使 用 了 虚拟 内 存 用 了 
Æ RAM 中 ， 可 以 使 i 




















， 然 而 
更 详细 


， 内 在 的 时 钟 实现 限制 


的 论述 。 




















是 不 能 中 断 的 [10]。 换 句 话说 ， 一 
I 系统 调用 
准备 好 运行 了 ， 它 将 不 得 不 





EE 入 的 问题 ,这 种 设计 和 
J 能 花费 很 长 时 间 来 完成 ， 对 于 一 个 实时 进程 来 说 长 


日 关 的 问题 是 系统 的 同步 。 为 了 保护 数据 可 外 
i 处 理 函 数 ， 系 统 设计 者 通常 在 临界 
的 方式 来 处 理 。 比 起 信号 量 (semaphores) 或 者 自 旋 锁 (spinlocks) 这 是 更 
有 效 的 技术 。 但 是 ， 禁 止 中 断 是 系统 能 力 与 系统 对 外 部 事件 的 快速 
坚决 多 处 理 器 系统 的 同步 化 问题 。 

-分 页 [10]。 虚 拟 内 存 技术 只 
运行 的 程序 超过 系统 RAM 的 容量 。 这 种 


的 方式 使 内 核 的 开发 





一 个 
的 完成 或 者 被 阻塞 为 止 。 假 如 
Af ft 


SET o 


为 简单 。 
































上 被 非 同 
区 代码 中 选择 关 












































是 保护 程序 





























些 根本 的 改变 。 


[。 然 而 ， 对 于 实时 系统 来 说 ， 虚 拟 内 存 引 
定性 达到 一 个 无 法 忍受 的 地 步 。 

所 有 考虑 的 这 些 因素 来 看 , 显然 传统 的 Linux 是 不 可 能 有 
我 们 需 














于 实时 处 理 。 


2.2 Linux 性 能 测试 


























寻找 提高 Linux 延 时 间 性 能 的 途径 。 


2.2.1 


= 
HR 


间 
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rp Br n] EAT AS I AS [8127 
要 的 是 非 同步 中 


中 断 延 迟 测试 




















AE 





! 断 发 生 到 
到 在 运行 任务 停止 和 中 断 分 派 














新 处 理 程序 

















NTA o 
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始 执行 之 间 的 时 间 差 。 这 个 时 间 差 包括 直 


一 个 直观 的 了 解 , 我 对 Linux 系统 进行 了 测试 。 
! 断 延迟 时 间 和 上 下 文 切换 。 对 测试 的 结果 进行 分 析 ， 以 





型 : 同步 和 非 同 步 中 断 。 对 应 用 程序 来 说 ， 
断 。 非 同步 中 断 发 生 的 情况 如 图 2.1 所 示 。 中 


断 啊 应 时 








Tor = 中 断 响 应 时 间 
任务 停止 






外 部 中 断 l 
中 断 分 派 


中 断 例 程 





开始 中 断 处 理 


图 2.1 异步 中 断 和 中 断 响应 时 间 























' 断 响应 时 间 并 不 是 一 个 常量。 它 与 操作 系统 和 硬件 平台 有 关 。 要 测 
量 精确 的 关闭 中 断 的 时 间 ， 并 不 是 通过 上 面 的 定义 来 进行 。 因 为 从 中 断 到 
来 到 当前 任务 停止 属于 中 断 延 迟 时 间 。 在 Linux 中 ， 内 核 或 驱动 程序 显 式 
地 关 / 开 中 断 ， 一 般 是 通过 调用 _cli0/_sti0 来 进行 操作 。 中 断 延 迟 程序 计 
算 一 对 __cli0/_sti0 调 用 之 间 的 时 间 。 在 调用 __cli0 时 ， 记 录 系 统 时 间 值 ， 
读 出 __sti0 被 调用 时 的 系统 时 间 值 。 他 们 之 间 的 时 间 差 就 是 关中 断 时 间 。 
Linux 下 的 关中 断 时 间 如 图 2.2 所 示 : 

关中 断 时 间 测 试 程序 重新 写 了 __cli0/_ sti0 宏 ， 以 允许 记录 调用 它们 
的 文件 以 及 在 何 处 调用 。 记 录 这 些 信息 以 分 析 在 Linux 中 那些 关中 断 时 间 
是 比较 长 。 (中断 测试 程序 的 代码 在 附录 A) 

我 对 Linux 进行 了 大 约 3 个 小 时 的 测试 ， 测 试 的 结果 如 表 。 在 测试 中 
运行 一 些 程序 ， 其 中 包括 一 个 磁盘 循环 捞 贝 程序 ， 打 开 一 些 应 用 程序 。 可 
以 发 现 系统 负载 比较 重 时 ， 系 统 的 页 面 调度 花 了 比较 多 的 时 间 ， 将 近 500 
微 秒 。 表 2.1 E 22 是 统计 结果 。 
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外 部 中 断 或 任务 停止 
系统 调用 








开始 中 断 处 理 






中 断 例 程 


关中 断 时 间 







图 2.2 ”关中 断 时 间 








中 断 关 闭 时 间 直 方 图 

















E JI 
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R21 中 断 关闭 时 间 直 方 图 
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中 断 关 闭 时 间 概 率 密度 函数 直方 图 




















E AIL 
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表 2.2 中 断 关 闭 时 间 概 率 密度 函数 直方 图 


可 以 看 出 在 我 的 测试 系统 中 系统 中 断 关 闭 时 间 最 大 达到 496 微 秒 , 一 
般 中 断 关 闭 时 间 是 在 250 微 秒 到 300 微 秒 左右 。 这 次 测试 并 没有 进行 所 有 
情况 下 的 测试 ， 从 这 些 结果 我 们 就 可 以 看 出 : Linux 的 系统 设计 人 员 采 用 
分 时 的 调度 、 低 的 计时 分 辨 率 、 非 占 先 式 内 核 、 关 中 断 和 虚拟 内 存 是 造成 
系统 关中 断 时 间 过 于 长 的 原因 。 



































2.2.2 ”上下文 切换 测试 





上 下 文 切换 时 间 是 保存 一 个 进程 状态 , 然后 恢复 为 外 一 个 进程 状态 的 
时 间 。 我 写 了 一 个 测试 程序 来 测试 这 个 时 间 (程序 见 附录 B) 。 程 序 运 行 
时 ,根据 输入 的 参数 来 决定 创建 多 少 个 进程 。 所 有 的 进程 用 一 个 环形 的 
UNIX 管道 连接 。 程 序 中 实现 一 个 令 牌 在 这 些 进程 之 间 传 递 ， 迫 使 进行 进 
程 间 的 上 下 文 切 换 。 程序 记录 在 进程 间 传 递 令 牌 2000 次 所 花 的 时 间 。 每 一 
次 令 牌 的 传递 有 两 个 开销 : 上 下 文 切换 开销 和 令 牌 传递 开销 。 程 序 首先 计 
算 令 牌 在 环形 管道 中 传递 的 开销 ， 在 输出 的 结果 已 经 除去 了 这 部 分 开销 。 

为 了 计算 更 真实 的 切换 时 间 ， 我 加 入 了 人 为 的 数据 在 里 面 ， 进 程 切换 
时 间 包 括 保存 用 户 级 数据 状态 的 时 间 。 测 试 的 结果 在 表 2.3 所 示 ，Y 轴 表 
示 切 换 时 间 ，X 轴 表 示 进 程 数 目 ，size 表示 进程 的 大 小 。 
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从 结果 看 ， 进 程 的 随 着 进程 的 大 小 变化 ， 切 换 时 间 在 增加 ， 在 16k 以 
内 增加 幅度 不 大 ， 是 因为 此 时 进程 的 大 小 还 没有 超出 一 级 缓存 的 大 小 ， 超 
过 16k 时 ， 增 加 幅度 比较 大 ， 进 程 大 小 达到 64k 时 ， 切 换 时 间 达 到 300 微 
秒 。Linux 切换 时 间 过 于 大 的 原因 是 系统 保存 了 过 于 多 的 状态 。 在 上 下 文 
切换 过 程 中 ， 系 统 是 关中 断 的 ， 意 味 着 此 时 的 系统 关中 断 时 间 超 过 300 微 
秒 。 对 于 实时 应 用 来 所 是 不 能 接受 的 。 








350 


=64k 





—€— size-2k 
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SK size-32k 
—6— size-64k 
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表 2.3 上 下 文 切换 时 间 


2.3 当前 的 实时 操作 系统 
在 这 一 节 我 们 来 看 看 一 些 操作 系统 的 设计 者 是 怎样 来 处 理 前 一 节 所 
提 到 的 问题 的 。 
最 简单 的 解决 方案 是 改变 分 时 的 调度 程序 。 一 个 例子 是 文献 [12] 介 绍 
的 系统 。MINIX 的 round-robin 调度 器 换 为 基于 优先 级 的 调度 器 。 由 于 在 
MINIX 中 不 使 用 页 面 调度 和 页 面 交 换 技术 , 假如 对 时 间 的 响应 不 过 分 要 求 
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的 话 ， 这 种 方法 是 可 以 接受 的 。 
一 些 在 UNIX 系统 



































采用 POSIX.1b-1993 实时 标准 规定 的 方式 。 这 个 


标准 规定 了 优先 级 调度 ， 锁 定 用 户 程序 页 面 ， 实 时 信号 ， 改 进 的 IPC 和 计 









































时 器 也 部 分 实现 。 内 核 的 不 可 








时 器 ， 和 别 的 一 些 特 性 。 依 从 这 些 标 准 使 UNIX 更 适合 实时 应 用 。 
Linux 是 部 分 支持 POSIX.1b 标准 的 操作 系 
HE, Æ Linux 中 完全 实现 了 适合 用 于 控制 的 调度 器 和 内 存 锁定 技术 ， 


占 先 ， 低 的 定时 精度 ， 和 高 的 中 断 延 迟 仍然 


统 


[12]。 从 1997 年 5 H 








1 
定 


没有 解决 。 因 此 ，POSIX.1b 兼容 的 Linux 操作 系统 











理 。 














只 适合 一 些 软 实时 的 处 


别 的 满足 POSIX.1b 的 操作 系统 是 QNX[26]. QNX 操作 系统 是 微 内 核 


口 


的 操作 系统 。 内 核 














络 通信 ， 和 和 中断 分 派 。 别 的 一 些 服 务 ， 比 如 说 设备 驱动 程序 和 文 


z` 


























实现 为 与 用 户 进程 
而 且 非 常 快 的 。 





QNX 兼容 POSIX 1003.1 标准 〈 编 程 接 














过 和 应 
供 标 ; 




















比 起 调 
QNX 






















































































的 。 








是 实现 4 种 服务 : 进程 调度 ， 进 程 间 通 信 ， 低 级 的 网 














TER, 





协同 操作 的 方式 。 这 样 系统 内 核 非常 小 (大 约 7KB 左右 ) 


口 ) 和 POSIX 1003.2 标准 (外 
用 程序 ) 。 对 于 熟悉 UNIX 的 开发 者 来 说 ， 是 非常 方便 的 。QNX pé 
EB] UNIX 部 件 : 编译 器 ， 调 试 器 ，X-Windows， 和 TCP/IP. 

微 内 核 的 设计 比 起 传统 的 单 块 结构 的 设计 有 很 多 优势 。 调 试 
试 内 核 模块 更 为 简单 。 假 如 
那样 ) ， 内 存 管理 错误 在 不 同 模块 是 相互 隔离 
得 多 线程 的 好 处 。 另 外 有 和 良好 的 裁剪 怕 











用 户 程 序 








用 户 进 程 运行 在 单独 的 地 址 空间 〈 像 














驱动 程序 可 以 更 获 


FE。 比如 ，QNX 可 以 减少 到 100KB 


以 下 以 适合 ROM 的 大 小 ， 或 者 扩展 到 全 功能 的 多 机 开发 环境 。 移 植 和 维 














护 微 内 核 的 系统 也 更 简单 。 缺 点 是 微 内 核 比 起 单 块 结构 


XË. 











对 于 实时 处 理 的 微 内 核 它 提供 了 轻 量 级 进 





IPC。 一 个 实时 的 用 户 进程 可 以 中 断 设备 驱动 程 
于 微 内 核 操作 系统 是 非常 小 的 ， 可 以 方便 
H UH HP DT aE IS FY TH] o 

大 多 数 的 微 内 核 操 作 系统 的 弱点 是 它 





不 可 能 
的 计时 参数 ， 





















































程 ， 快 的 上 下 文 切换 ， 和 
Ee 序 ， 在 单 块 结构 的 内 核 是 


的 内 核 来 说 不 那么 




















系统 在 进程 间 通 信和 上 下 文 交换 有 比较 重 
提供 简单 的 系统 服务 。 
务 微 内 核 操 作 系统 要 进行 更 多 的 系统 调用 。 
换 ， 消 息 传 递 等 可 以 高 效 地 实现 [2]， 就 性 
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因此 ， 与 单 块 结 构 





























的 计算 最 坏 情况 下 








的 性 能 要 差 。 微 内 核 结构 的 操作 
的 系统 开销 。 
的 操作 系统 相 比 ， 完 成 相同 的 任 
虽然 一 些 研 究 者 认为 上 下 文 切 





微 内 核 操 作 系统 只 




















能 而 言 ， 
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单 块 结构 的 操作 系统 仍 


然 更 成 功 。 


一 个 单 块 结构 的 操作 系统 的 例子 是 VxWorks[27]。VxWorks 是 专 有 的 





实时 操作 系统 , X 














用 主机 / H 标 机 方式 o =` UNIX 4 
运行 程序 的 非 实 时 部 分 。 一 个 叫 wind 的 VxWorks 内 核 在 目 




















时 任务 。 机 器 间 的 通信 使 用 TCP/IP 网 络 连接 。 





范 的 函数 ， 特 别 是 
有 的 。 




















POSIX.1b 实时 扩 








在 VxWorks 





!， 内 核 和 任务 运行 在 同一 个 地 址 





切换 非常 快 ， 和 省 去 了 必要 的 系统 
装载 任务 和 系统 模块 。 这 些 特性 使 系统 具有 好 的 人 
似 C 语法 的 shell 用 来 检查 和 改变 参数 值 ， 计 算 表达 式 ， 
简单 的 调试 。 这 个 特性 使 得 























fj 











E? 


CHL 


虽然 VxWorks 不 兼容 UNIX 系统 ， 它 提供 了 一 些 符合 POSIX X 


P x d 


E 间 。 这 样 ， 任 务 间 的 





用 来 软件 的 开发 和 








标 机 上 运行 实 








口 规 


展 部 分 。 大 多 数 的 VxWorks API 是 专 

















调用 开销 。 











个 实 









































缩 性 。 





发 更 为 简单 方便 。 内 核 和 


EU 


个 地 址 空间 也 使 得 系统 更 脆弱 ， 一 个 模块 的 错误 更 容易 





REAL/IX 操作 系统 也 是 单 块 结 
系统 ， 原 自 于 UNIX System V， 改 造 使 它 拥有 实时 处 理 









































构 。 这 是 一 个 有 完 

















X 
全 UNIX 特性 的 操作 


能 力 。 它 的 内 核 是 


时 连接 器 允许 动态 的 





一 个 交互 式 的 类 
调用 函数 ， 和 进 
EB ISAT EIA] — 
HS Olm Er. 











完全 可 占 先 的 。 它 通过 内 核 信 号 量 来 实现 ， 提 供 互 斥 方式 访问 系统 资源 ， 





比 起 传统 的 sleep/wakeup 函数 和 关 
中 断 降低 了 中 断 延 迟 时 间 , 也 使 的 移植 到 多 处 怪 


HAE 



































P 断 来 说 ， 这 种 方式 更 优秀 。 使 用 信和 号 

















更 为 容易 。 





REAL/IX 是 POSIX.1003 兼容 的 操作 系统 。 这 个 特性 使 得 移植 UNIX 











应 用 程序 


件 空间 ， 同 步 与 非 同 步 UO, 
用 户 进 程 处 理 

现在 有 一 个 趋向 于 使 
容 先 前 的 Windows， 因 此 ， 可 以 使 用 先前 的 应 




















的 特性 允许 








作 系统 来 做 任何 事 


情 


更 为 容易 。 除 实时 调度 以 外 ， 实 时 能 力 还 包括 
增强 的 IPC 和 计时 器 ， 可 连接 的 中 断 。 最 后 

















中 Dir. 


























用 Windows NT 来 文 持 实时 处 理 。 只 要 


预先 分 配 内 存 和 文 























大 














原 FEAR 





























办 公 应 用 ， 





H: 











以 减少 人 员 培 训 的 

















定 的 延迟 ， 而 ] 


个 问题 。 


Microsoft 为 了 处 理 上 面 提 到 的 
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因 。 

















的 方式 可 能 引起 一 个 不 确 











些 问 题 。 
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用 程序 。 也 是 指望 用 一 个 操 
服务 ， 和 实时 控制 。 用 一 个 操作 系统 可 
销 。 程 序 员 可 以 用 到 广泛 的 Win32 API. Microsoft 对 
市 场 的 垄断 也 是 一 个 原 

像 文献 [25] 指 出 的 那样 ，Windows NT 的 内 核 并 不 适合 人 硬 实时 的 处 理 : 
Win32 API 不 是 设计 用 来 实时 应 用 的 ， 中 断 处 型 
HX F BRA ASR UL, Windows NT 对 内 存 的 要 求 也 是 一 






































# J Windows CE IKA IÑ 


实时 操作 系统 ，Windows CE 内 核 文 持 按 优 先 级 抢占 的 方式 调度 多 任务 。 

Windows CE 可 以 固化 到 ROM P, M ROM 起 动 ， 使 用 时 对 内 存 RAM 要 
求 不 高 。Windows CE 将 中 断 分 为 两 个 步骤 : 第 一 步 是 执行 中 断 服 务 子 程 
FF ISRünterrupt service routine); 第 二 步 为 中 断 服务 线程 IST(interrupt service 
thread)。 内 核 使 中 断 处 理 程序 执行 尽 可 能 短 ， 大 部 分 处 理 放 在 IST 中 ， 可 
以 把 最 高 优先 级 安排 给 中 断 服务 线程 , 以 保证 IST 尽快 运行 而 不 会 被 占 先 。 
其 与 Win32 API 兼容 的 编程 接口 方便 熟悉 Windows 的 程序 员 开 发 和 移植 
Windows 应 用 。 
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^x 


zm 


LEO BRANGXSCHI LINUX 系统 


RTLINUX 的 设计 与 实现 


从 上 一 章 的 分 析 ， 我 们 已 经 知道 Linux 是 一 个 通用 操作 系统 ， 将 它 应 


FAT HRA SUSE IN AEA ES DORAN Eo 特别 是 
TD NED fe AAA DII Wid BE, RECTE A Si hI AY TR] ANG 
乏 高 精度 的 计时 器 。 所 以 要 对 现 有 的 Linux 进行 











关闭 























在 运行 内 核 线程 时 ，Linux 


XE VE, tk 






































改造 ， 即 要 对 Linux 进行 


实时 化 ， 这 一 章 将 介绍 RTLinux 的 结构 和 如 何 对 RTLinux 进行 实时 化 。 


Del 


RTLinux 使 


序 。 一 个 小 的 实时 内 核 与 








列 中 标记 这 次 中 断 的 发 生 
列 中 的 中 断 将 被 执行 。 
而 
中 的 进程 
HY ï 



























































作为 
双 内 核 的 操作 系统 ， 实 时 
内 核 可 以 看 作 实时 系统 的 


个 


基本 内 核 与 实时 








这 样 实 现 的 RTLinux 的 详 旨 
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于 实时 内 核 的 中 断 将 直接 被 处 理 ， 
序 处 理 。 假 如 Linux 内 核 中 断 请 求 没 有 被 允 
。 当 Linux 内 核 的 
因此 ， 实 时 内 核 的 操作 可 
H. Linux 内 核 不 能 延迟 实时 任务 的 执行 。 实 时 任务 与 运行 在 Linux 内 核 
之 间 的 通讯 通过 FIFOs 与 共享 内 存 的 方 
周 度 器 调度 实时 任务 ，j 
也 已 经 实现 了 RMS 和 EDF $ 
这 样 就 保留 了 Linux 操作 系统 所 提供 的 


RTLinux HJ Zë 











ST Linux 


^r 





























, 








Hr 


构 


用 众所周知 的 虚拟 机 技术 的 简单 方案 来 解决 这 些 相互 对 立 
的 解决 上 面 提 到 的 问题 。 增 加 了 一 个 仿真 程序 来 蔡 换 Linux 的 底层 
Linux 内 核 共享 控制 处 理 器 。 如 果 来 
内 核 的 中 断 通 过 中 断 仿真 程 








AER 
^tt] 





js 














全 
































! 靳 模拟 程序 将 在 中 断 队 
青 求 被 允许 时 ， 在 中 断 队 
以 得 到 机 器 的 立即 相应 ， 






































式 进 行 。 使 用 实时 内 核 中 










































































由 度 器 的 算法 和 策略 可 











以 用 户 自 己 定义 ， 而 系统 
























































法 。 
富 的 功能 ， 而 且 改动 它 使 其 
内 核 共享 控制 CPU。 实 际 上 ， 系 统 可 以 看 作 具 有 
内 核 拥 有 更 高 优先 级 别 的 任务 ， 换 名 话说 ， 基 本 
空闲 任务 :只 是 在 没有 实时 处 理 要 求 的 时 候 运 行 。 
结构 图 如 图 3.1 所 示 。 
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EE 


Linux 系 统 














图 3.1 RTLinux 详细 结构 图 


3.2 ”中断 模拟 


要 在 标准 Linux 上 增加 人 硬 实时 能 力 ， 首 先 














了 达到 同步 使 用 关中 断 的 方式 。 混 杂 在 一 块 的 


器 的 cli 和 sti 机 器 指令 ) 造成 不 可 确定 的 中 断 分 派 延 迟 。 





整 块 大 的 内 核 。 在 提供 系统 服务 各 个 部 分 之 间 











的 要 求 仍然 太 长 。 
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在 实时 Linux 中 ， 是 通过 在 Linux 内 核 与 
模拟 软件 ， 这 是 与 文献 [6 相似 的 技术 ， 但 是 用 于 不 同 的 
代码 中 所 有 的 cli，sti， 和 iret Gret: 中 断 返 回 指 令 ) 被 替换 为 相应 的 宏 : 
S CLL S STI fll S IRET. Britt] 







































































能 处 理 这 些 ， 











过 到 的 一 个 问题 是 Linux 为 
关 和 开 中 断 操作 (i486 处 理 
Linux 内 核 是 一 
没有 一 个 保护 的 分 界线 。 要 
改写 Linux 内 核 感 到 非常 棘手 。 造 成 要 限定 关中 断 的 时 间 非 常 困难 ， 当 更 
新 版 本 发 行 时 ， 也 可 能 变 得 不 正确 。 即 使 我 们 






































时 间 上 离 我 们 














! 靳 控制 便 伯 
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F 之 间 增 加 一 个 


目的 。 在 Linux 源 





中断 指 令 都 被 中 断 模拟 器 捕捉 。 


/* These are macros */ 














SEC TID: movl $0, SFIF 
S IRET: push Sds 
pushl %eax 
pushl %edx 
movl SKERNEL DS, %edx 
mov $dx, %ds 
elt 
movi SFREQ, %edx 
andl SFMASK, %edx 
bsrl Sedx, %eax 
jz not found 
movl $0, SFIF 
sti 
jmp SFIDT ( , %teax, 4) 
not fount: 
movl Sil, SEDE 
sti 
popl Sedx 
popl $eax 
pop Sds 
iret 
SSeS pushfl 
pushl SKERNEL CS 
pushl $done STI 
S. IRET 
done STI: 
程序 3.1 “SR” cli, sti 和 iret 





关中 断 发 生 时 ， 在 模拟 器 的 一 个 变量 重新 设 定 。 


器 将 检查 这 个 变量 。 假 
的 中 断 处 理 程序 将 立即 
将 不 会 被 调用 。 一 个 变 
H Linux 中 断 允 许 处 理 
H Wr o 







































































o 


如 这 个 值 是 已 经 设 定 (Linux 
调用 。 如 果 Linux 中 断 是 不 允许 的 ， 中 断 处 理 程序 
量 值 将 设 定 ， 并 且 保 存 所 有 挂 起 的 中 断 的 信息 。 
里 。 这 种 中 断 称 之 为 软 




















只 要 中 断 发 生 ， 模 拟 


















































! 汤 是 允许 的 )，Linux 


























时 ， 所 有 挂 起 的 中 断 将 被 处 ] 


























于 Linux 不 能 直接 控制 中 断 控 制 器 ，Linux 的 中 断 不 会 影 





a 








响 实时 





S_CLI、S_STI 和 S_IRET 宏 如 程序 3.1 所 示 。 这 个 代码 使 用 GNU JE. 


设置 1 


范 。S_CLI 宏 简 单 
E 在 被 处 理 的 中 断 
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重新 设 定 





变量 值 ， 保 存 Linux 























IRA. S STI E 


的 栈 。S_IRET 宏 模 拟 中 断 返 回 。S_IRET 宏 的 工作 








就 像 硬 件 iret 指 





S IRET 宏 是 三 个 宏 中 最 有 意思 
化 指向 内 核 的 数据 段 寄 存 
设置 的 屏蔽 位 。 如 果 没 有 发 现 挂 起 的 中 断 ， 设 置 
指令 被 执行 。 如 果 发 现 一 个 中 断 ， 跳 转 到 





的 中 断 返 回 


中 断 处 理 程序 返回 后 ， 依 次 跳 转 到 下 








到 没有 中 断 














扫描 和 转 到 中 断 处 理 程序 
描 将 不 能 发 现 











中 断 发 生 扫 











令 所 做 的 那样 

















允许 软 中 断 。 
































再 挂 起 为 止 。 














会 延迟 处 理 


使 用 链 式 跳 转 的 方式 来 代替 子 程序 调 
后 者 不 能 完全 模拟 直接 的 中 断 处 理 。 


序 ， 是 因为 





， 直 到 下 一 个 S_STI 或 者 S_IRET 被 执行 是 才 色 
用 的 方式 调 














栈 来 发 现 是 
护 中 断 状 态 


实时 任务 是 一 个 用 户 定义 的 程序 ， 








是 很 重要 的 。 





方式 来 执行 。 


最 开始 的 设计 是 给 每 一 个 实时 任务 有 自己 的 地 址 
护 。 这 通过 80x86 处 理 器 内 置 的 分 页 机 制 [10]。 在 每 次 






































目录 是 基于 

任务 间 
切换 的 开销 
保护 模式 下 

一 种 提 
特性 是 
接 为 内 核 








寄存 器 的 变 


的 切换 非常 频繁 ,如果 
性 能 会 降低 。 
也 是 个 费时 的 操作 。 
n e 
， 除 去 了 保护 模式 变换 的 系统 开销 。Linux 
= 内 核 模块 可 以 动态 连接 到 内 核 地 址 空 
每 个 模块 定义 了 两 个 例 程 : 


很 大 ， 系统 

















代码 。 





的 
器 。 然 后 存 取 全 


^r. 








局 变量 。 扫 


















































新 状态 变量 




















个 未 处 理 


新 的 中 断 处 理 

















是 一 个 原子 操作 ， 


E 何 挂 起 的 中 断 ， 这 个 新 到 






































3.3 实时 任务 





化 来 指向 











F TLB 没有 命 




















和 否则， 在 这 过 程 
的 中 断 的 处 理 
E 被 处 理 。 





所 有 挂 起 的 








H 


Linux "P M Ab H 

















它 先 保存 一 些 寄存 器 和 初始 
中 断 而 
ë, À 
程序 。 
程序 ， 直 














Ph 有 一 个 
程序 将 
































H] Linux H 


Linux 





它 按照 在 内 核 控 制 下 的 


空间 来 提供 








P 断 处 理 











程 














HH Br A HË 





程序 检查 


























用 户 还 是 内 核 代 码 被 中 断 ， 基 于 这 个 做 出 决定 处 理 。 因 此 ， 保 


地 定 的 调度 


内 存 保 




















新 任务 的 页 目录 。 























=> 


别 的 系统 开销 还 
































HL HE F 


上 下 文 切 换 





1 S 
































x [R] « 通过 使 

















页 


! 时 ， 使 得 系统 在 上 下 文 
是 系统 的 调用 ， 


在 





个 很 有 用 的 
zH, HI 
init module() 和 


cleanup. module(). init, module0 在 模块 装载 到 内 核 是 调用 , cleanup. module() 


在 删除 模块 





和 文件 系统 。 











时 调 





可 链接 
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用 。 这 就 提供 了 一 











模块 





163.net 


用 以 在 当 
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前 的 RTLinux 中 动态 创建 实 











个 简单 的 方法 在 Linux 中 操作 驱 








动 程序 


时 任务 。 这 种 实现 方 


法 也 更 脆弱 :一 个 实时 任务 的 错误 可 能 引起 整个 系统 的 骨 演 。C 语言 的 使 


























用 加 重 了 这 个 问题 。 数 组 、 指 针 等 的 应 用 ， 很 容易 引 
错误 。 男 一 方面 ， 
用 与 系统 内 核 编 程 

实时 任务 运行 在 内 核 地 址 空间 有 几 个 好 处 .除了 上 
问题 和 保护 模式 切换 的 问题 外 , 这 种 方法 使 我 们 通过 名 字 
































于 实时 任务 一 般 控 制 昂贵 的 外 转 


时 相同 的 警告 级 别 。 




















起 与 内 存 相关 的 程序 
设备 ， 理 所 当然 要 使 
































tds TLB 命中 

















胜 于 通过 描述 符 来 引用 。 比 如 ， 实 时 任务 表现 为 一 个 C H 
务 可 以 由 











引用 函数 和 对 象 ， 











的 结构 体 。 每 个 任 


F À C 标识 符 ， 别 的 任务 也 可 以 通过 这 个 标识 符 引 用 任务 。 动 





态 链接 执行 过 程 中 ， 模 块 装载 解决 了 符号 寻 址 问题 ， 所 以 访问 是 非常 高 效 


的 。 


























所 有 的 人 有 


























E 务 在 系统 的 地 址 空间 ， 任 务 的 切换 也 更 简单 。 


个 上 下 文 切 





换 是 保存 所 有 整数 寄存 器 到 栈 中 ， 改 变 栈 的 指针 指向 新 的 任务 。 同 样 也 支 
持 有 学 点 运算 的 任务 。 


为 实时 任务 进行 实时 纺 


3.3.1 











程 的 接口 将 在 第 








四 章 介绍 。 
































实时 线程 数据 结构 


struct rtl thread struct 
SErUCE re Sbhreacemsiructe 


ryan joseph @ loi net 


int *stack; 

int fpu_initialized; 
RTL_FPU_CONTEXT fpu_regs; 
int uses_fp; 

int *kmalloc_stack_bottom; 








struct rtl sched param sched param; /* 线程 调度 参数 */ 
struct rtl thread struct *next; /* 链表 中 下 一 个 线程 */ 








int cpu; /* 线程 的 CPU 号 */ 

hrtime t resume time; /* 恢复 时 间 */ 
hrtime t period; /* 任务 周期 */ 
hrtime t timeval; 

struct module *creator; /* 线程 创建 者 */ 
void (*abort) (void *); 

void *abortdata; 

int threadflags; 

rtl sigset t pending; 

rtl sigset t blocked; 

void *user[4]; 

int errno val; 

Struct rtl cleanup struct *cleanup; 
int magic; 

struct rtl posix thread struct posix data; 
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void *tsd [RTL PTHREAD KEYS MAX]; 











程序 3.2 rtl thread. struct 结构 


3.3.2 创建 线程 和 线程 调度 














+H 
7N 























间 。 


线程 操作 相关 的 函数 将 在 第 四 章 介绍 。 


实时 调度 器 的 





表示 时 间 的 约束 和 很 多 的 i 


略 。 






































一 个 实时 程序 使 用 一 个 或 几 个 线程 来 执行 。 线 程 是 轻 量 级 进程 ， 它 们 
享 公共 的 地 址 空间 。 在 RTLinux 中 ， 所 有 的 线程 共享 Linux 内 核 地 址 空 























3.4 实时 调度 





























只 要 任务 是 满足 所 有 实时 任务 的 时 间 要 求 。 有 很 多 方法 
周 度 策略 [和 ]。 不 存在 一 个 适合 所 有 任务 的 调度 策 




















在 大 多 数 实 时 系统 中 ， 调 度 器 是 由 大 的 、 复 杂 的 代码 块 组 成 ， 它 也 不 
可 能 扩展 到 适用 任何 情况 。 用 户 只 是 通过 调节 参数 来 改变 调度 器 的 行为 ， 


— 








在 RTLinux 中 ， 















































储 往 这 是 不 够 的 。 一 般 调 度 器 代码 也 比较 慢 。 








Ed 








允许 用 户 编写 自己 的 调度 器 代码 。 可 以 把 它 实现 为 一 











个 可 装载 的 内 核 模块 。 这 就 使 得 可 以 实验 不 同 的 调度 策略 和 算法 ， 以 找到 














一 个 最 适合 自己 应 


用 的 调度 方式 。 





3.4.1 实现 的 调度 器 


迄今 为 止 实现 了 两 种 调度 器 。 一 个 是 基于 优先 级 的 占 先 式 调度 器 。 调 
度 策略 如 下 所 述 。 每 个 任务 赋予 一 个 唯 





























的 优先 级 。 假 如 有 几 个 任务 处 于 





就 绪 状 态 ， 优 先 级 最 高 的 那个 将 运行 。 只 要 一 个 优先 级 更 高 的 任务 就 绪 ， 
它 就 可 以 中 断 当前 较 低 优先 级 任务 的 执行 。 每 个 任务 假定 它 可 以 自由 的 放 





弃 CPU。 






































这 个 调度 器 直接 支持 周期 任务 。 每 个 任务 的 周期 和 开始 时 间 是 可 以 给 
定 的 。 一 个 中 断 驱 动 的 ( 非 周 期 的 ) 任务 通过 定义 中 断 处理 程 序 ， 然 后 通 
过 中 断 处 理 程序 来 唤醒 相应 的 任务 。 






































根据 每 个 任务 的 周期 和 它 












































门 的 终止 时 间 ， 很 自然 的 我 们 可 以 根据 速率 


单调 调度 算法 (rate monotonic scheduling algorithm, RMS)[5] 决 定 每 个 任务 
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的 优先 级 。 根 据 这 个 算法 ， 周 期 短 的 任务 有 高 的 优先 级 。 对 于 有 nn 个 任务 











的 实时 调度 来 说 ， 满 足下 面 公式 的 实时 任务 将 能 够 成 功 的 调度 ， 每 个 任务 











都 不 会 超过 它们 的 最 终 期 限 (deadline): 
Cr Ci eng Cn aai 
T, T, n 
这 里 ，C, 为 任务 i 在 每 个 周期 的 最 长 执行 时 间 ， 工 为 任务 i 
期 任务 将 处 理 为 周期 任务 ， 同 样 赋予 一 个 优先 级 [5]。 
调度 器 把 Linux 当 作 一 个 有 最 低 优先 级 的 任务 。Linux 







































































录 ， 而 且 禁 止 软 中 断 。 当 切换 回来 时 ， 软 中 断 状 态 将 恢复 。 
































的 周期 。 非 周 





只 在 没有 实时 

















任务 运行 时 运行 。 为 此 ， 从 Linux 切换 到 实时 任务 时 ， 软 中 断 状态 将 被 记 


另外 一 个 调度 器 是 根据 最 早期 限 优先 算法 (Earliest Deadline First, 
EDP) 实 现 的 。 在 这 个 算法 中 没有 静态 的 优先 级 。 而 是 最 靠近 最 终 期 限 


























(deadline) 的 任务 总 是 最 先 执行 。 





3.4.2 设计 用 户 自己 的 调度 器 





















































RTLinux 作为 开放 的 系统 ， 具 有 以 下 的 优势 方便 用 户 设 计 自 己 的 调度 





器 ， 以 实现 自己 特有 的 调度 方式 : 
e 一 个 分 时 复 用 的 基于 优先 级 调度 的 内 核 ; 
e 有 精确 可 靠 的 时 间 片 划分 ; 
e 精确 的 时 钟 控制 原 语 ; 
e 快 且 可 预测 的 中 断 响 应 和 进程 切换 时 间 ; 








IL 
















































































RTLinux 的 调度 器 在 文件 rtl. sched.c 和 rtl. schedule.h 











GEX, KIR 











程 可 以 在 创建 时 用 函数 pthread_attr_setschedparam 设置 或 在 运行 中 


























pthread, setchedparam 改变 其 优先 级 。scheduler 将 系统 的 优先 级 设 为 -1， 而 


所 有 实时 线程 的 优先 级 大 于 0， 从 而 保证 实时 线程 优先 执行 。 用 户 需 要 

















动 的 是 rt_schedule《〈 调 度 过 程 ) 函数 ， 两 个 重要 的 数据 结 











kJ: schedule t 


和 rtl, thread. struct; 和 任务 队列 task queue *list, task queue *destlist. 
































调度 算法 。 
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通过 对 以 上 的 数据 结构 和 调度 过 程 的 修改 , 用 户 可 以 自己 实现 特定 的 
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3.5 计时 


精确 的 计时 是 正确 的 调度 器 操作 是 必须 的 。 调 度 器 常常 要 求 在 一 个 特 
定 的 时 刻 进行 任务 切换 。 计 时 的 错误 将 引起 背离 计划 的 调度 ， 导 致 任务 释 
放 抖 动 (task release jitter)[24]。 在 大 多 数 的 应 用 中 任务 释放 拌 动 是 不 好 的 。 
要 尽量 减少 它 的 影响 。 

低 的 时 间 精 度 一 个 原因 是 在 操作 系统 中 ， 使 用 周期 的 时 钟 中 断 。 系 统 
设计 者 必须 在 时 钟 中 断 处 理 函 数 开销 与 计时 精度 之 间 做 一 个 折 中 [24]。 有 
时 候 使 用 周期 时 钟 并 不 能 得 到 要 求 的 计时 器 定时 精度 。 

在 Linux 中 也 是 一 样 。 在 IBM 兼容 的 PC 上 ， 硬 件 定 时 器 的 时 钟 中 断 
速率 设 定 为 大 约 100Hz 左右 。 因 此 ， 任 务 可 以 达到 10 毫秒 的 精度 。 一 些 
商业 的 操作 系统 ， 比 如 VxWorks. REAL/IX 也 是 使 用 周期 的 时 钟 中 断 ， 尽 
管 它们 允许 用 户 改变 中 断 频 率 。 

在 RTLinux 中 ， 消 除 这 个 折 中 是 在 需要 的 时 候 才 通过 使 用 一 个 可 编程 
间隔 定时 器 来 中 断 CPU 。 特 别 地 ， 使 Intel 8354 定时 器 芯片 工作 在 
interrupt-on-terminal-count 模式 。 使 用 这 种 模式 ， 可 以 使 中 断 调度 得 到 1 微 
秒 左右 的 精度 。 这 种 方法 的 定时 器 精度 高 而 系统 开销 是 最 小 。 

H Linux 模拟 了 一 个 周期 的 中 断 。 使 用 软 中 断 是 非常 简单 的 : 为 了 模 
拟 一 个 中 断 要 求 ， 一 个 未 处 理 的 中 断 屏蔽 位 被 设 定 。 在 下 一 个 软 中 断 返 回 
时 ， 或 者 软 sti 执行 时 ， 处 理 函 数 将 被 调用 。 
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3.5.1 时 间 相 关 函 数 
时 间 相 关 的 函数 将 在 第 四 章 介 绍 。 





3.6 进程 间 通 信 





由 于 Linux 内 核 任何 时 候 都 可 能 被 实时 任务 占 先 ，Linux 线程 不 能 安 
全 地 被 实时 任务 调用 。 不 管 怎样 ， 必 须要 有 一 些 进 程 间 通信 (PC) 的 机 制 。 
RTLinux 提供 了 三 种 通信 方法 。 
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3.6.1 FIF0 设备 


RTLinux 用 FIFO 管道 来 在 Linux 进程 或 者 Linux 内 核 与 实时 进程 间 传 
递 数据 ， 这 种 管道 称 为 实时 管道 (real-time FIFOs)， 以 区 别 UNIX IPC 机 制 





中 的 管道 。 



























































RT-FIFO 管道 是 在 内 核 地 址 空间 的 。 通 过 一 个 整数 来 引用 。RTEFIFOs 

















ç 








的 数目 在 编译 系统 时 给 定 ， 可 以 重新 编译 系统 改变 大 小 。 
操作 RT-FIFOs 的 函数 包括 创建 、 删 除 、 读 FIFO 和 写 FIFO。 读 写 操 
作 是 原子 操作 ， 不 能 中 断 。 不 可 中 断 是 为 了 避免 优先 级 倒置 问题 。 





在 Linux 进程 中 
调用 。 字 符 设 备 给 用 户 一 个 与 实时 任务 通信 的 全 功 角 


(APD 。 这 个 接口 对 Linux 进程 来 说 是 标准 的 设备 接口 ， 包 括 : open, close, 





> 
































read ÁH writes 


struct file_operations rtf_fops 


static 


{ 


struct file_operations rtf_fops = 


rtf_llseek, 
rtf_read, 
Tate tanita Sy 


L 


Gr 2 inc cM GEGEN 
en [es [eb eh 


C 
fee! de ei Ei deuy des) 











a dme qm im [me dep fm dnp Za (m) Usb JS 





3r 
poll, 
Ar 
Ar 
open, 


3r 


_ release, 














下 面 是 原始 的 存 取 例 程 : 








int rtf create(unsigned int minor, int size) 
int rtf destroy (unsigned int minor) 

Sat, ere uns gnecsntemuimnos yo cg uds nt 
int rtf get(unsigned int minor, void *buf, int 





























对 于 每 个 FIFO 管道 可 以 通过 


int rtf_create_handler (unsigned int minor, 
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count) 
count) 


, JË RT-FIFOs 当 作 普通 的 字符 设备 ， 而 不 是 一 个 系统 











日 程序 接口 
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,的 处 理 





É 程序 
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int (*handler) (unsigned int fifo)) 





H 





3. 6.2 














A 





使 用 的 内 存 大 小 ， 
的 共享 内 存 。 


Linux 进程 也 通过 























在 RTLinux 任务 


共享 内 存 
在 RTLinux 启动 的 时 候 ， 通 过 指定 
E 出 来 的 内 存 空 


数据 从 FIFO 



























































成 实时 任务 和 Linux 进程 之 间 的 通信 。 











3.6.3 mbuff 驱动 程序 

















nt E 
Eb XE 





Tomasz Motylewski 提供 的 一 个 使 


' 读 出 或 写 出 时 运行 。 


内 核 一 个 mem 参数 决定 内 核 可 以 
EH F SK A 
中 通过 /dev/mem VS fei Bt MI FFA 
寸 读 取 这 段 内 存 的 数据 获得 实时 任务 提供 的 信息 ， 这 样 完 











F 务 和 Linux 进程 进行 通信 
Hk, 
































来 实现 核心 内 存 空 


mbuff_alloc0 的 函数 给 
这 个 名 字 来 管理 
RTLinux 的 Linux 内 核 内 存 空 

















#include <mbuff. 


la] REL FJ > Z le 
请 的 内 存 
EE 这 些 申 请 的 


























用 共享 内 存 的 驱动 程序 ， 用 




















] 的 共享 。 





通过 使 用 mbuff 提供 的 














区 一 个 名 字 , mbuff H 
内 存 。 通 过 这 个 驱动 程序 也 可 以 在 包括 














K 动 程序 使 


用 一 个 链 























h> 


间 和 用 户 内 存 空间 2 





间 共 享 内 存 。 


void * mbuff alloc(const char *name, int size); 


void mbuff free(const char *name, 





第 一 次 调 





用 mbuff alloc 











块 将 
失败 时 返回 NULL。 


分 配 。 这 个 内 存 块 的 引 





用 数 设 


N CL 
给 定 





如 果 


时 ， 给 定 一 个 名 字 ， 一 个 
用 成 功 返 回 新 内 存 块 的 





调 


为 1。 


的 名 字 已 经 存在 ， 将 返 








针 ， 
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void * mbuf); 

















给 定 大 小 的 共享 内 存 
Ht. 


E 的 内 存 块 的 指 








H 








ffü 








以 操作 这 块 共享 内 存 块 ， 该 内 存 块 的 引用 数 将 加 1。 
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第 四 音 ”RTLinux 应 用 程序 设计 


4.1 程序 结构 











每 个 实时 应 用 程序 可 以 分 为 两 部 分 : SEIN 
时 部 分 在 用 户 空间 执行 ， 称 为 用 户 部 分 。 实 时 部 分 要 尽 可 能 简单 ， 只 包含 
直接 与 时 间 相 关 的 代码 ;由 于 人 硬件 对 时 间 的 约 台 
码 一 般 也 包含 在 实时 部 分 。 用 户 部 分 的 代码 主要 实现 为 数据 的 处 理 ， 包 括 















































分 和 非 实时 部 分 [2]。 非 实 
































数据 的 发 布 、 保 存 和 用 户 界面 。 两 部 分 之 间 的 通信 采用 数据 组 


图 4.1 所 示 的 数据 流程 图 是 依照 这 个 程序 模型 的 典型 实时 应 用 程序 。 
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RT-FIFO 





图 4.1 程序 结构 图 
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4.2 基本 API 


4.2.1 POSIX 线程 创建 函数 


就 像 前 面 介绍 的 那样 ， 一 个 实时 程序 是 由 几 个 执行 的 线程 组 成 的 。 线 
程 是 轻 量 级 进程 ， 它 们 共享 共有 的 地 址 空间 。 在 RTLinux 中 ， 所 有 的 线程 
共享 Linux 内 核 地 址 空间 。 
int pthread create (pthread, t *thread, pthread_attr_t * attr, void * (* 





























start routine)(void *), void *arg) 


这 是 RTLinux 的 标准 POSIX 线程 创建 函数 。 这 个 线程 运行 函数 指针 
start_routine 指向 的 过 程 ，arg 是 这 个 函数 的 指针 的 入 口 参数 。 线 程 的 属性 
attr 对 象 决定 ， 可 以 为 这 个 属性 设置 CPU 号 、 推 栈 大 小 等 属性 。 设 定 知 
为 NULL, 将 会 使 用 默认 属性 ,返回 0 表示 成 功 创建 线程 ,线程 号 放 在 thread 
所 指向 的 空间 ; 返回 非 0 线程 的 属性 决定 在 特定 的 CPU 上 
创建 线程 (pthread_attr_setcpu_np)， 是 否 使 用 FPU(pthread_attr_setfp_np). 






































pn 






























































a 



































int pthread_attr_init (pthread_attr_t *attr) 


初始 化 线程 运行 的 属性 。 


int pthread_ attr_setschedparam (pthread_attr_t *attr, const struct 
sched. param *param) 和 int pthread, attr setschedparam (const 
pthread attr t *attr, struct sched param *param) 


这 两 个 函数 根据 程序 的 需要 相应 地 从 attr 中 设 定 / 取 得 线程 的 运行 参 
数 。param 是 为 调度 的 SCHED_FIFO 和 SCHED_RR 策略 定义 的 属性 。 





























int pthread, attr setcpu np (pthread, atte t *attr, int cpu) 和 
int pthread attr getcpu np (pthread atte t *attr, int cpu) 

设 定 /取得 线程 运行 的 CPU 号 。 在 SMP 机 器 上 允许 线程 在 一 个 特定 
的 CPU 上 运行 。 











int pthread_cancel (pthread_t thread) 
取消 一 个 运行 的 线程 。 
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int pthread_delete_np (pthread_t thread) 


删除 一 个 线程 ， 并 且 释 放 该 线程 的 所 有 资源 。 返 回 0 表示 成 功 删 除 ， 
非 0 表示 删除 失败 。 








pthrad_t pthread_self (void) 


获得 当前 正在 运行 的 线程 号 











clockid, t rtl. getschedclock (void) 


获得 当前 调度 方法 的 时 钟 。 











int rtl setclockmode (clockid t clock, int mode, hrtime t mode param) 











设置 当前 的 时 钟 模式 ，mode=RITL_CLOCK_MODE_ONESHOT 时 是 
非 周 期 (一 次 性 ) 模式 mode param 参数 无 用 ; 
mode-RTL CLOCK MODE PERIODIC 时 是 周期 模式 ，mode_param 参数 
是 周期 的 长 度 。( 有 关 时 钟 模式 见 3.4 节 的 说 明 ) 






































int pthread_wait_np (void) 


当前 周期 的 线程 运行 结束 ， 总 是 返回 0。 























4.2.2 时 间 相 关 函 数 
RTLinux 提供 了 一 些 时 钟 函数 用 于 计时 功能 ， 包 括 线程 调度 ， 获 得 


TSP(timestamps) 等 。 


下 面 的 是 一 般 的 计时 函数 : 


/* #include «rtl time.h> */ 








int clock_gettime(clockid_t clock_id, struct timespec *ts); 
hrtime_t clock_gethrtime(clockid_t clock); 


struct timespec ( 

time ttv sec;/* fb ai 
long tv. nsec; P 纳 秒 */ 
k 
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clock_gettime: 读 取 当 前 的 时 间 ， 保 存 到 clock id 所 指 的 对 象 
clock_gethrtime: 读 取 当前 时 间 ， 但 返回 一 个 64 位 (hrtiime_0 的 " 秒 时 
间 值 。 
































一 些 时 间 转 换 的 函数 ， 用 于 把 时 间 格 式 转 换 为 男 外 一 种 格式 。 
时 间 转 换 函 数 : 


/* #include «rtl time.h> */ 





hrtime_t timespec_to_ns(const struct timespec *ts); /* timespec 到 纳 秒 数 转换 */ 
struct timespec timespec_from_ns(hrtime_t t); /* 纳 秒 数 到 timespec 转换 对 
const struct timespec * hrt2ts(hrtime_t value); /* 

















下 面 是 一 些 文 持 的 时 钟 类 型 。 
时 钟 类 型 相关 的 宏 : 

€ CLOCK MONOTONIC: POSIX 时 钟 ， 以 恒定 速率 运行 ， 不 会 复 
位 和 调整 


€ CLOCK REALTIME: 标准 POSIX 实时 时 钟 。 目 前 与 
CLOCK_MONOTONIC 时 钟 相 同 
€ CLOCK_RTL_SCHED: 调度 器 用 来 任务 调度 的 时 钟 











以 下 是 机 器 结构 相关 的 时 钟 : 
€ CLOCK_8254: TE x86 单 处 理 器 机 器 上 用 于 调度 的 时 钟 
€  CLOCK APIC: 用 在 SMP x86 机 器 的 时 钟 











4.2.3 线程 调度 函数 

RTLinux 提供 一 些 调 度 方式 ， 允 许 线程 代码 在 特定 的 时 刻 运行 。 
RTLinux 使 用 单纯 优先 级 驱动 的 调度 器 ， 更 搞 优 先 级 的 线程 总 是 被 选择 运 
行 。 如 果 两 个 线程 的 优先 级 拥有 一 样 的 优先 级 ， 选 择 那 一 个 线程 运行 是 不 
确定 的 。RTLinux 使 用 下 面 的 调度 API: 

























































































int pthread_setschedparam (pthread, t thread, int policy, const struct 
sched param *param) 


设置 一 个 线程 的 调度 参数 ， 用 policy 和 sched param 两 个 参数 设置 
thread 的 调度 参数 属性 : 
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policy=SCHED_RR: 使 用 Round-Robin 方法 调度 
policy=SCHED_FIFO: 使 用 先进 先 出 的 方法 调度 
返回 0 表示 成 功 调度 ， 非 0 表示 失败 。 





























int pthread getschedparam (pthread t thread, int policy, const struct 
sched param *param) 


获得 一 个 线程 的 调度 参数 。 将 获得 的 policy 和 sched. param 结构 放 在 
入 口 参数 所 指向 的 地 址 里 面 。 








int pthread_make_periodic_np (pthread t thread, hrtime start time, 
hrtime t period) 

这 个 函数 标记 thread 线程 为 可 和 运行。 线程 将 在 start_time 时 刻 开 始 运 
行 ， 运 行 的 时 间 间 隔 由 period 给 定 。 
































int pthread_wait np (void) 
pthread wait np 函数 将 挂 起 当前 运行 发 线程 直到 下 一 周期 。 这 个 线程 
必须 是 pthread_make_periodic_np 函数 标记 为 可 执行 。 





























int sched_get_priority_max (int policy) 和 
int sched_get_priority_min (int policy) 
确定 sched priority 可 能 的 值 。 


4.3 编程 示例 











前 面 介 绍 了 RTLinux 的 基本 API， 在 这 里 以 一 个 实例 来 说 明 RTLinux 
下 的 编程 方法 。 这 是 一 以 测试 RTLinux 下 中 断 延迟 的 程序 。 正 如 前 面 所 说 
的 ， 程 序 分 为 两 部 分 ， 实 时 部 分 和 非 实 时 部 分 。 实 时 部 分 通过 使 用 一 个 模 
块 ， 在 将 实时 模块 插入 后 ， 运 行 实时 任务 。 对 于 非 实 时 部 分 ， 实 现 对 FIFO 
设备 的 读 取 ， 完 成 和 实时 任务 的 通信 。 


图 4.2 实时 程序 结构 图 
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4.3.1 实时 部 分 
init module 完成 对 实时 部 分 的 初始 化 。cleanup_module 实现 关闭 实时 
模块 的 任务 。 


/* * RTLinux scheduling accuracy measuring example */ 


#include <rtl.h> 
#include «rtl fifo.h» 
#include «time.h» 
#include «rtl sched.h» 
#include «rtl sync.h» 
#include «pthread.h» 
#include «unistd.h» 
#include «rtl debug.h» 
#include <errno.h> 








#include "common.h" 


int ntests-500; 

int period-1000000; 

int bperiod-3100000; 
int mode-0; 

int absolute-0; 

int fifo size-4000; 

int advance-0; 


MODULE PARM (period, "i") ; 
MODULE PARM (period, "i"); 
MODULE PARM(ntests,"i"); 
MODULE PARM (mode, "i"); 
MODULE PARM(absolute,"i"); 
MODULE PARM (advance, "i"); 








pthread t thread; 
Int ge TEE O, 


void *thread_code (void *param) 
{ 

hrtime_t expected; 
hrtime_t diff; 
hrtime_t now; 

hrtime_t last_time = 0; 
hrtime_t min_diff; 
hrtime_t max_diff; 
struct sample samp; 

ime als 

aligns Gaie, = (Op 
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int cpu id = rtl getcpuid(); 


rtl printf ("Measurement task starts on CPU %d\n", cpu id); 
if (mode) ( 

int ret = rtl setclockmode (CLOCK REALTIME, 
RTL CLOCK MODE PERIODIC, period); 





if (ret != 0) ( 
conpr("Setting periodic mode failed\n"); 
mode = 0; 
} 
} else { 


rtl_setclockmode (CLOCK_REALTIME, RTL_CLOCK_MODE_ONESHOT, 








0); 
} 


expected = clock_gethrtime (CLOCK_REALTIME) +2 * (hrtime t) period; 





fd fifo = open("/dev/rtf0", O_NONBLOCK) ; 

abíg (E CORRER O < (0) 4 
rtl printf("/dev/rtf0 open returned %d\n", fd fifo); 
return (void *) 1s 


if (advance) { 


rtl stop interrupts (); /* Be careful with this! The task won't 
be preempted by anything else. This is probably only appropriate 
for small high-priority tasks. */ 


) 


/* first cycle */ 

clock nanosleep (CLOCK REALTIME, TIMER ABSTIME, hrt2ts (expected 
— advance), NULL); 
expected += period; 
now = clock gethrtime (CLOCK_MONOTONIC) ; 
last time - now; 











do { 
min diff 
max diff 


2000000000; 
-2000000000; 


for (i = 0; i « ntests; i++) { 
cE titers) 


clock_nanosleep (CLOCK_REALTIME, TIMER_ABSTIME, 
hrt2ts (expected - advance), NULL); 





now = clock_gethrtime (CLOCK_MONOTONIC) ; 
if (absolute && advance && !mode) { 
if (now < expected) { 
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rtl_delay (expected - now); 
) 


now = clock gethrtime (CLOCK_MONOTONIC) ; 
) 
if (absolute) ( 

diff = now expected; 
} else { 

diff = now - last_time - period; 

aie (GEL < O) 4 

CELE — SGA 





alae ME < Te 
mincoiff = ditf; 


if (diff > max diff) { 


max diff = diff; 


expected += period; 
last time - now; 





samp.min = min diff; 
samp.max = max diff; 
write (fd fifo, &samp, 
) while (1); 
return 0; 


) 


sizeof (samp)); 


pthread_t background_threadid; 


void *background thread(void *param) 


{ 

hrtime_t next = 

while (1) { 
hrtime_t t = gethrtime (); 
next += bperiod; 





clock_gethrtime (CLOCK REALTIME); 











/* the measurement task should preempt the following loop */ 
while (gethrtime() < t + bperiod * 2 / 3); 


clock nanosleep (CLOCK REALTIME, TIMER ABSTIME, hrt2ts (next), 
NULL); 


} 
} 








int init_module (void) 


{ 
pthread_attr_t attr; 


struct sched_param sched_param; 
int thread_status; 
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dint eft omsteai us 


rtf destroy (0); 
fifo status = rtf create(0, fifo size); 
if (fifo status) ( 
rtl printf("RTLinux measurement test fail. 
fifo status-$dWMn",fifo status); 
return -1; 


rtl printf("RTLinux measurement module on CPU 
$dWMn",rtl getcpuid()); 


pthread attr init (&attr); 
if (rtl epu exists (19i 


pthread_attr_setcpu_np (&attr, 1); 
) 


sched param.sched priority = 1; 
pthread_attr_setschedparam (&attr, &sched param); 
rtl_printf ("About to thread create\n"); 


thread status = pthread create (&thread, &attr, 
(Veirem) Hn E 


if (thread status != 0) ( 


thread code, 


rtl printf("failed to create RT-thread: %d\n", 
thread status); 


return -1; 
) else { 


rtl printf ("created RT-thread\n") ; 


if (bperiod) { 
pthread_create (&background_threadid, NULL, 
background_thread, NULL) ; 
} 
return 0; 


} 


void cleanup_module (void) 
{ 


rtl_printf ("Removing module on CPU %d\n", rtl_getcpuid()); 

pthread_cancel (thread) ; 
pthread_join (thread, NULL); 
close (fd_fifo); 
rtf_destroy (0); 
if (bperiod) { 

pthread_cancel (background_threadid) ; 

pthread_join (background_threadid, NULL); 
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4.3.2 非 实 时 部 分 


非 实 时 部 分 实际 上 建行 就 是 一 个 应 用 程序 ， 可 以 在 控制 台 下 编写 。 不 
过 必须 有 /dev/rtf0 设备 的 读 取 权限 才能 运行 。 


#include <stdio.h> 
#include <errno.h> 
#include <sys/time.h> 
#include <sys/types.h> 
#include <fcntl.h> 
#include <unistd.h> 
#include <sys/ioctl.h> 
#include «rtl fifo.h» 
#include "common.h" 























int main() 

{ 

aan GIO 

alio. aye 

struct sample samp; 


if ((fd0 = open("/dev/rtf0", O RDONLY)) < 0) { 
fprintf(stderr, "Error opening /dev/rtf0in"); 
exit (1); 


while (1) { 

n = read(fd0, &samp, sizeof (samp) ); 

printf("min: %8d, max: %8d\n", (int) samp.min, (int) 
samp.max); 

fflush (stdout) ; 
} 


return 0; 


} 


4.3.3 编译 和 运行 程序 
在 一 台 Celeron 412MHz, 196MB 内 存 ，RTLinux3.1 的 机 器 上 进行 如 
下 的 Makefile 编译 : 


all: rt process.o irqsema.o monitor histplot 





biel ele de SE 


monitor: monitor.c 
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$(CC) ${USI 


clean: 


rm E *.o monitor histplot periodic monitor gnuplot.out 





ER CFLAGS) S$(INCLUDI 





include $ (RTL DIR) /Rules .make 





min: 
min: 
min: 
min: 
min: 
min: 
min: 


则 程序 可 以 测试 
j 0, max: 
max: 


zm a~ 


` 


SS a Ss 


Seo ooo eo oe © C 
` 


` 
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max: 
max: 
max: 
max: 
max: 
max: 
max: 
max: 
max: 





24480 
10720 
10912 
10976 
11072 
10656 
10944 
11200 
11200 
11008 
10912 
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PED 





度 ， 程 序 的 运 








E) -Wall -O2 -o monitor monitor.c 
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第 五 音 RTLINUX 的 性 能 测试 


根据 2.2 节 有 关中 断 延 迟 的 介 
断 延 迟 进行 测试 。 

















绍 。 在 这 一 章 ， 我 们 将 对 RTLinux 的 
测试 的 机 器 为 Celeron 412MHz，196MB 内 存 ， 
RTLinux3.1+Linux-2.2.19 (与 前 面 测试 的 Linux 版 本 相同 ) 的 机 器 上 进行 了 
测试 〈 测 试 程 序 在 附录 2)。 
































测试 的 结果 如 表 5.1 所 示 : 









































负载 类 型 平均 值 最 小 值 最 大 值 
无 负载 2.36 2.10 15.50 
TT TRAP I 3.20 2.10 19.40 
计算 负载 2.56 2.20 14.50 








# 5.1 实时 中 断 延 迟 时 间 (ët, 微 秒 ) 
W EAR: 所 有 进程 已 经 杀 死 




















= HERMAN: 一 个 便 盘 
WR ”计算 负载 : 一 个 循环 执行 浮 点 运算 上 
从 测试 结果 看 ，RTLinux 的 中 断 上 





UC 程序 


各 应 时 间 明 显 小 于 标准 Linux 的 中 








循环 拷贝 shell 脚本 在 运行 














断 响 应 时 间 。 在 磁盘 揽 贝 负载 下 最 大 延迟 为 19.40 微 秒 ， 在 这 种 负载 情况 





下 ， 标 准 














Linux 的 延迟 达到 了 500 微 秒 。 
为 了 计算 调度 精度 ， 我 们 运行 了 一 个 周期 实时 任务 。 在 每 个 周期 任 








务 唤醒 时 ， 记 录 下 了 # 





微 秒 左右 。 
从 上 
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比较 它 的 时 间 ， 记 录 下 最 大 的 时 间 值 。 





时 间 值 在 10 





结果 看 ，RTLinux 是 完全 可 以 胜任 实时 运算 的 操作 系统 。 
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hk ` IE 
BINE 





当前 ， 
出 现 的 市 场 
整个 世界 将 














以 信息 家 电 为 
只 是 冰山 一 角 。 
加 网 络 化 ， 计 算 化 





























ay, 4H 


AL IUS 


o 








与 体会 


ULHRA A SUE EEA WAR. IF ABLE 
FAA» RAA F GAH A 28 BEAR ÈI AIR > 








TREE E Z HNI, D CAE AERA RK BUS ZÉ I SF 





则 ， 给 新 生 
开放 源 














制 的 方便 ， 我 们 完全 可 以 从 多 个 软件 中 提取 需要 的 精华 ， 应 




















的 公司 以 机 会 。 
码 软 件 的 特点 注定 了 




















化 的 世界 。 嵌 入 式 系统 也 是 千变万化 的 ! 嵌入 式 系统 的 这 种 特点 注定 了 其 
市 场 的 碎片 化 。 任 何 公司 都 没有 足够 的 能 量 统一 市 场 。 这 带 来 新 的 游戏 规 





它 非 常 适 合 儒 入 式 系统 。 开 放 源 码 导 致 定 




















用 到 


自己 的 应 

















用 上 去 ， 大 大 节省 了 开发 成 本 。 我 认为 以 服务 为 主导 ， 以 开放 源码 软件 为 








支柱 的 公司 
我 们 知 


中 ， 更 重要 的 是 定制 ， 是 干 变 万 化 的 应 
的 商业 软件 ， 由 于 不 能 形成 规模 成 本 将 非常 高 





VK He ARAMA 


道 ， 形 成 规模 才能 时 



































致 成 本 的 降 
DES 














F 的 重要 角色 。 
&, MES HMHI BRA AÁ HÈ 
Bi. FEA, RAHE BI UR 
。 DAR, WAH 





ERR dr ARIES 








IS Windows CE, PalmOS 等 成 熟 的 系统 形成 优势 , 但 从 长 远 的 角度 来 看 ， 


开放 源码 软件 更 加 适合 嵌入 式 系统 。 我 们 期 待 着 
放 源 码 软件 很 好 的 出 路 。 也 希望 中 略 












































的 出 现 ， 并 且 认为 商品 化 是 
业 能 在 开放 源码 软件 革命 中 获得 











几乎 以 免费 方式 就 可 以 获得 的 Linux， 
话说 ， 到 底 什么 样 的 系统 最 需要 Linux? RUA FÉ 


Linux: 
e 














VË Z Hs. 




















其 商业 价值 











多 成 熟 的 


放 源 码 软件 
的 软件 












































到 底 在 哪里 ? BRA] 
三 种 系统 最 应 该 使 用 














安全 相关 的 系统 。 这 些 系统 应 该 使 用 开放 源码 的 系统 ， 以 防止 封 


闭 系统 留 下 的 各 种 后 门 。 这 包括 关键 的 网 络 服务 器 、 政 府 部 门 和 














军用 服务 器 、 工 作 站 等 等 。 
实时 系统 。 对 各 种 实时 性 系统 来 讲 ， 底 层 的 操作 系统 同样 不 能 建 





立 在 黑箱 之 上 。 这 包括 工业 控制 用 的 实时 系统 , 各 种 军用 系统 等 。 


URA TU KR H o HRA dër Kou 








MM AS, NISHA ASEM E > 


没有 也 不 应 该 有 通用 的 系统 。 为 了 达到 定制 ， 就 需要 开放 操作 系 


统 的 源码 。 这 也 是 原先 许多 Windows CE 


的 原因 。 
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因此 , CIA JS Linux 大 显 身手 的 地 方 。 国 内 外 的 许多 开 
发 商 早 就 看 到 了 这 一 点 , 并 在 岩 入 式 Linux 的 开发 方面 投入 了 大 量 的 人 力 
和 资金 。 综合 说 来 , 以 Linux 作为 操作 系统 开发 嵌入 式 系统 , 有 如 下 优势 : 
@ Linux 的 可 移植 性 好 ， 开 发 工具 丰富 。 每 个 CPU 开发 商 在 发 布 
每 一 款 新 的 嵌入 式 CPU 时 ， 均 会 投入 大 量 人 力 移植 Linux 内 
核 ， 并 提供 丰富 的 开发 工具 。 

o BOUTS. Linux 内 核 的 源码 开放 ,可 大 大 方便 系统 的 定制 开发 。 

e 可 用 资源 丰富 。 在 Linux 系统 上 进行 开发 时 , 可 以 获得 的 源 代码 
等 资源 比 其 他 封闭 系统 多 得 多 。 

© 成 本 低 。Linux 的 低 成 本 特点 ， 可 大 大 降低 最 终 谍 入 式 系统 的 成 
本 ， 并 扩大 开发 商 的 获 利 空间 。 
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附录 A 


中 断 延 迟 测试 代码 : 




















这 是 一 个 补丁 (patch) 文 件 ， 在 我 的 Linux-2.2.12 版 本 下 编译 通过 。 通 过 下 


a 





面 的 命令 粘贴 到 Linux 源 文件 中 : 


# cd /usr/src/linux-2.2.12 
# patch -pl < /usr/src/linux-2.2.12/interrupt-latency-2.2.12-patch 


粘贴 完成 后 编译 Linux 内 核 : 





# cd /usr/src/linux-2.2.12 

# make config # 配置 内 核 

# make dep 

# make bzImage # 编译 内 核 

f make modules — # 编译 模块 

# make modules install # 装载 模块 

# cp arch/i386/boot/bzImage /boot/interrupt-lattency 





配置 LILO， 编 辑 /etc/lilo.conf， 把 下 面 几 行 添加 进 : 














image=/boot/interrupt-latency 
label=interrupt-lattency 
read-only 
root=/dev/hdal 


重新 装 LILO: 








# /sbin/lilo 


重启 后 在 LILO 提示 符 下 输入 : 








LILO: interrupt-latency 
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i 




















N 
VA 


H 


则 可 以 监控 系统 调用 开 /关中 断 的 内 核 就 起 动 完成 , 还 需要 运行 一 个 用 户 
间 程 序 (view.c， 见 下 面 ) 用 于 输入 命令 和 打印 测试 结果 。 

















ag 




















interrupt-latency-2.2.12-patch 文件 如 下 : 


diff --exclude=version.h --exclude=config.h -Nru linux-2.2.12/arch/i386/kernel/Makefile 
linux-2.2.12-interrupt/arch/i386/kernel/Makefile 

——- linux-2.2.12/arch/i386/kernel/Makefile Wed Jan 20 10:18:53 1999 

+++ linux-2.2.12-interrupt/arch/i386/kernel/Makefile Mon Mar 6 11:04:25 2000 

@@ -14,7 414,9 @@ 


O TARGET := kernel.o 
O OBJS := process.o signal.o entry.o traps.o irq.o vm86.0 \ 
一 ptrace.o ioport.o ldt.o setup.o time.o sys_i386.0 


+ ptrace.o ioport.o ldt.o setup.o time.o sys i386.0 \ 
+ intr blocking.o 

+ 

OX OBJS := i386 ksyms.o 

MX OBJS ze 


diff --exclude-version.h --exclude-config.h -Nru linux-2.2.12/arch/i386/kernel/entry.S 
linux-2.2.12-interrupt/arch/i386/kernel/entry.S 
——- linux-2.2.12/arch/i386/kernel/entry.S Fri Apr 30 08:13:37 1999 
+++ linux-2.2.12-interrupt/arch/i386/kernel/entry.S Mon Mar 6 11:05:10 2000 
@@ -96,6 +96,7 QQ 
movl $dx,$es; 





#define RESTORE ALL N 
































+ incl intrData; \ 
popl %ebx; N 
popl $ecx; \ 
popl %edx; \ 
@@ —562,6 +563,8 @@ 
.long SYMBOL NAME (sys ni syscall) Jr streamsl */ 
.long SYMBOL NAME (sys ni syscall) /* streams2 */ 
.long SYMBOL NAME (sys vfork) 7755 190) *7 
+ 
+ .long SYMBOL NAME (sys get intrData) fe Noi ci 
/* 





* NOTE!! This doesn't have to be exact - we just have 
diff --exclude-version.h --exclude-config.h -Nru linux-2.2.12/arch/i386/kernel/head.S 
linux-2.2.12-interrupt/arch/i386/kernel/head.S 
——- linux-2.2.12/arch/i386/kernel/head.S Anois! Wein Il eee Si ea) Ieee) 
+++ linux-2.2.12-interrupt/arch/i386/kernel/head.S Mon Mar 6 11:14:26 2000 
@@ -316,6 +316,7 @@ 
movl Sax, Bes 
pushl Sint msg 
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call SYMBOL NAME (printk) 
ar incl intrData 

popl $eax 

popl $ds 

popl $es 
diff --exclude-version.h --exclude-config.h -Nru 
linux-2.2.12/arch/i386/kernel/intr blocking.c 
linux-2.2.12-interrupt/arch/i386/kernel/intr blocking.c 
a linux-2.2.12/arch/i386/kernel/intr blocking.c Wed Dec 31 16:00:00 1969 
+++ linux-2.2.12-interrupt/arch/i386/kernel/intr blocking.c Mon Mar 6 11:41:50 2000 
@@ -0,0 41,322 QQ 
+#include «asm/system.h» 
+ 
+ 
十 /大大 大 大 platform 太太 大 大 / 
+#define readclock (low) \ 


+ — asm. — volatile _ ("rdtsc" s "=a" (low) a a "edx') 
+ 

YS Jonis Sy 

+#define NUM LOG ENTRY 4 

+#define INTR IENABLE 0x200 

+ 


+/**** data structure ****/ 
+struct IntrData { 

/* count interrupt and iret */ 
int breakCount; 


/* the test name */ 
const char * testName; 


/* flag to control logging */ 
unsigned logFlag; /* 0 - no logging; 1 - logging */ 


/* panic flag - set to 1 if something is realy wrong */ 
unsigned panicFlag; 


/* for synchro between start and end */ 
unsigned syncFlag; 


/* we only log interrupts within certain range */ 
unsigned rangeLow; 
unsigned rangeHigh; 


/* count the total number interrupts and intrs in range*/ 
unsigned numIntrs; 
unsigned numInRangeIntrs; 


/* error accounting */ 
unsigned skipSti; 
unsigned skipCli; 


十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 
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unsigned 
unsigned 
unsigned 
unsigned 
unsigned 


Suc 


Too +++ ++ ++ coco oc boo +++ 


+struct IntrData intrData 


0, 


1, 


de db de db de de dk db de de de xb ob dp db de d dh ode de db de 


syncStil 


Error; 





syncClil 


Error; 


stiBreakError; 


restoreSti; 
restoreCli; 


unsigned startCount; 





ENEE ENEE 


ENTRY]; 


"interrupt latency test 


uS ME UD DOS ey 


+#if 0 


+void intr check int(int x) 


ard 
+ 
unsigned 


flag; 


/* worst blocking time */ 
unsigned blockingTime; 


const char * startFileName; 
unsigned startFileLine; 


const char *endFileName; 
unsigned endFileLine; 
unsigned endCount; 

} count [NUM LOG | 


= 


+ 
+ _ intr_save_flags (flag); 
+ 
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(4 distinctive entries)", 
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if ((flag & INTR IENABLE) != 0) ( 
switch(x) ( 
case 0 





intrData.count[0].blockingTime ++; 
break; 
case 1 
intrData.count[0].startFileLine ++; 
break; 
case 2 
intrData.count[0].startCount ++; 
break; 
case 3 





intrData.count[0].endFileLine ++; 
break; 

case 4 
intrData.count[0].endCount ++; 
break; 

default 
intrData.count[0].startFileName = "Wrong check number"; 
break; 








} 

} else { 

switch(x) { 

case 0 
intrData.count[1].blockingTime ++; 
break; 

case 1 
intrData.count[1].startFileLine ++; 
break; 

case 2 
intrData.count[1].startCount ++; 
break; 

case 3 
intrData.count[1].endFileLine ++; 
break; 

case 4 
intrData.count [1] .endCount ++; 
break; 

default 
intrData.count[1].startFileName = "Wrong check number"; 
break; 








de de db db db db de db de de de de de db db d db de d d de d de db de kb de db d dr dk de de d de dE de M de db de db db d 


+static inline void intr_SetPanic(unsigned x, const char *fname, unsigned l) 
ard 
+ if (intrData.panicFlag != 0) { 
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/* double error; impossible */ 
intrData.panicFlag = 99; 
return; 
} 
intrData.panicFlag = x; 
intrData.count [0] .startFileName 
intrData.count [0] .startFileLine 


fname; 
1; 


de de de de de de db db d 


+static const char *intrStartFileName; 

+static unsigned intrStartFileLine; 

+static unsigned intrStartCount; 

+ 

+/* strategy : 

+ * if it is true "cli", i.e., clearing the IF, we remember 
+ * everything, and clear breakCount. 

+ */ 

+void intr_cli(const char *fname, unsigned lineno) 

aed 


+ 


unsigned flag; 
. intr save flags(flag); 


EE REC 


/* if we are not logging or we have an error, do nothing */ 
if ((intrData.logFlag == 0) || ( intrData.panicFlag !- 0)) { 
return; 


/* do nothing we had IF cleared before we call this function */ 
if ((flag & INTR IENABLE) == 0) ( 

intrData.skipCli ++; 

return; 





/* debug */ 
if (intrData.syncFlag == 1) { 
ZntrDaeta-syncCcliError b, 





intrData.syncFlag = 1; 
intrData.breakCount - 0; 


/* Read the Time Stamp Counter */ 
intrStartFileName - fname; 
intrStartFileLine = lineno; 
readclock (intrStartCount); 


de de de de dB ode db de de dé db dk db de db dk db db db db de db de d db db de db de d 


+/* strategy: 
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+ 
+ 
+ 
+ 


* 
* 


* 


SCH 


we do a count only if 
1. syncFlag is 1 (a valid cli() was called) 
2. breakCount is 0 (no iret is called between cli() 


+void intr sti(const char *fname, unsigned lineno) 


acd 


+ 


de db de db db db db db di d d db db de de de db de d db db db db db dr db db de de Jb de db de db dh db db db db de db de Ab d 


unsigned flag; 
unsigned endCount; 
unsigned diff; 

shake abe 


_ intr_save_flags (flag); 


and this sti() 


/* if we are not logging or we have an error, do nothing */ 


if ((intrData.logFlag -- 0) | | ( intrData.panicFlag 
intr stií)s 
return; 


d'Stater Lr kemis zët et 3621 Stir 37 
if ((flag & INTR IENABLE) != 0) ( 
intrData.skipSti ++; 
Aner srt) 
return; 











/* check 1*/ 

if (intrData.syncFlag != 1) { 
intrData.syncStiError ++; 
— 3ntr sti) 
return; 





/* check 2 */ 

if (intrData.breakCount != 0) ( 
intrData.stiBreakError ++; 
— Intr stt) 
return; 


/* read count again */ 

readclock (endCount) ; 

intrData.syncFlag = 0; 

diff = endCount - intrStartCount; 

if ((diff >= intrData.rangeLow) && (diff <= intrData 


unsigned lowest-Oxffffffff; 
unsigned lowestIndex; 
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les (099 3 


.rangeHigh)) 


{ 
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de db Ab db db db de d de db d de de dë d d db de d d de d de db de kb de dr d dr dk de de d de dE de db de dE de db db d 


+void intr_restore_flags (const char *fname, unsigned lineno, unsigned x) 


aril 
+ 


+ 
+ 
+ 


unsigned sameIndex = Oxffffffff; 


intrData.numInRangeIntrs++; 


/* check if we need to log this event */ 


for 


if (samelndex == 0xffffffff) 


( 


i=0; i< NUM LOG_ENTRY; 


saepe 3 


if (lowest > intrData.count[i].blockingTime) ( 


abge 


lowest = 
lowestIndex = i; 


( (lineno == intrData.count[i].endFileLine) && 
(intrStartFileLine == intrData.count[i].startFileLine) && 
(fname[0] == intrData.count[i].endFileName[0]) && 


(intrStartFileName [0] 


/* if the line numbers are same, 


"s Jett desti 


intrData.count [i] .blockingTime; 


== intrData.count [i] .startFileName [0] ) 





S Enes. SA 
sameIndex = i; 


names ar 


same, 


( 


i = lowestIndex; 
) else ( 
i = sameIndex; 


if (diff » intrData 


count 
count 


intrData. 
intrData. 
count 
count 
count 
count 
count 


intrData. 
intrData. 
intrData. 
intrData. 
intrData. 


intrData.numIntrs++; 
SE 


unsigned flag; 





H- H- H- H- H- H- H 


Wi 


the first chars in 


consider it is the same 


.count[i].blockingTime) ( 





.blockingTime - diff; 

.endFileName - fname; 

.endFileLine = lineno; 

.endCount = endCount; 
.startFileName = intrStartFileName; 
.StartFileLine = intrStartFileLine; 
.StartCount = intrStartCount; 


/* if we are not logging or we have an error, do nothing */ 
if ((intrData.logFlag == 0) || ( intrData.panicFlag !- 0)) { 
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) 


H 


_ intr_restore_flags (x); 
return; 


. intr save flags(flag); 





if (((flag & INTR IENABLE) == 0) && 
((x & INTR IENABLE) != 0) ) ( 
intrData.restoreSti ++; 











intr sti(fname, lineno); 





if ( ((flag & INTR IENABLE) != 0) && 
((x & INTR IENABLE) == 0) ) { 

intrData.restoreCli ++; 

intr cli(fname, lineno); 





intr restore flags (x); 


ds de de db de dé de db db de de de de de de de de db db db dh 


+#include <asm/uaccess.h> 


+ 

*asmlinkage int sys get intrData(void ** ptr) 
and 

+ return put user(&intrData, ptr); 

sel 


diff --exclude=version.h --exclude=config.h -Nru linux-2.2.12/include/asm-i386/system.h 
linux-2.2.12-interrupt/include/asm-i386/system.h 

--- linux-2.2.12/include/asm-i386/system.h Mon Oct 11 21:28:12 1999 

+++ linux-2.2.12-interrupt/include/asm-i386/system.h Mon Mar 6 11:08:02 2000 

@@ -174,13 4174,33 @@ 

#define wmb() __asm__ volatile ("": : :"memory") 


/* interrupt control.. */ 

















Tf 0 

#define sti() asm volatile ("sti": : :"memory") 

#define pO asm volatile . ("cli": : :"memory") 

#define | save flags(x) \ 

. asm — volatile  ("pushfl ; popl $0":"-g" (x): /* no input */ :"memory") 
#define ` restore flags(x) \ 

—-asm-— — volatile-—("pushl $0 ; popfl": /* no output */ :"g" (x):"memory") 
+#endi f 

+#define intr-stid) asm volatile ("sti": : :"memory") 

+#define EECH asm volatile__ ("cli": : :"memory") 

+#define _ intr save flags(x) \ 

* asm volatile  ("pushfl ; popl %0":"=g" (x): /* no input */ :"memory") 
+#define intr restore flags (x) \ 

* asm volatile  ("pushl $0 ; popfl": /* no output */ :"g" (x):"memory") 
+ 


ryan_joseph@163.net Copyright 2002 杨 立 峰 51 





qs sung */ 

+extern void intr cli(const char *, unsigned); 

+extern void intr sti(const char *, unsigned); 

+extern void intr restore flags(const char *, unsigned, unsigned); 
*extern void intr sync flag(const char *, unsigned lineno); 

+ 

+#define ` cli() intr cli( FILE , INE ) 

+#define ` sti() intr sti( FILI 7 INE ) 

+#define ` save flags(x) \ 























S| 











+__asm__ __volatile__("pushfl ; popl %0":"=g" (x): /* no input */ :"memory") 
+#define __restore_flags(x) intr restore flags( FILE , LINE-—— X) 





#ifdef | SMP — 


@@ -197,9 «217,8 @@ 


#define cli() | cli() 
#define sti() __sti() 


—fdefine save_flags(x) __save_flags (x) 
+#define save flags(x) __save_flags (x) 
#define restore_flags(x) __restore_flags (x) 
#endi f 

/* 


用 户 空间 程序 view.c 如 下 : 


#include <sys/types.h> 
#include <sys/stat.h> 
#include <unistd.h> 
#include <fcntl.h> 
#include <assert.h> 


(KKKkKk k k k k k k k k Kk Kk Kk Kk k k CONF'IG KKkKkKkh k k k K Kk Kk k k k k x / 

















#define NUM LOG ENTRY 4 
#define CLOCK_FREQUENCY 266 /* cycles per microsecond */ 
#define SYSCALL_NUMBER 19a 





ckckckckckockckckckckckckckockckck kk OP kkkkkkkkkkkkkkk 
/ END OF CONFIG if 








#define CMD_EXIT 0 
#define CMD_DISPLAY ii 
#define CMD_START 2 
#define CMD STOP 3 
#define CMD_CONTINUE 4 
#define CMD_SET_RANGE 5 
#define CMD_LAST 6 





Struct IntrData 4 
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/* count interrupt and iret */ 
int breakCount; 


/* the test name */ 
const char * testName; 


/* flag to control logging */ 
unsigned logFlag;  /* 0 - no logging; 1 - logging */ 


/* panic flag - set to 1 if something is realy wrong */ 
unsigned panicFlag; 


/* for synchro between start and end */ 
unsigned syncFlag; 


/* we only log interrupts within certain range */ 
unsigned rangeLow; 
unsigned rangeHigh; 


/* count the total number interrupts and intrs in range*/ 
unsigned numIntrs; 
unsigned numInRangeIntrs; 


/* error accounting */ 
unsigned skipSti; 
unsigned skipCli; 
unsigned syncStiError; 
unsigned syncCliError; 
unsigned stiBreakError; 
unsigned restoreSti; 
unsigned restoreCli; 





struct 
/* worst blocking time */ 
unsigned blockingTime; 


const char * startFileName; 
unsigned startFileLine; 
unsigned startCount; 


const char *endFileName; 
unsigned endFileLine; 
unsigned endCount; 
} count [NUM_LOG_ENTRY] ; 
}; 


unsigned pData; 
struct IntrData data; 
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int kmem; 
char buf[81]; 


unsigned int GetInt(const char *prompt) 
{ 

unsigned int i; 

printf("$s", prompt); 

scanf("£d", &i); 

‘ev Es 


unsigned int GetHex (const char *prompt) 
{ 

unsigned int i; 

printf("$s", prompt); 

scanf ("%x", &i); 

return i; 


unsigned GetCommand () 
{ 
for(;;) { 
unsigned cmd; 
prime (CAm 
printf ("Command Menu Mn"); 
printf ("=============\n") $ 
printf("O0-Exit 1-Display 2-Start logging 3-Stop logging 4-Continue\n") ; 
printf("5-Set rangeWn"); 
mee ger Olli E 
TEE Ee 
scanf("$u", &cmd); 
if ((cmd >= 0) && (cmd < CMD LAST)) { 
return cmd; 
) else ( 
printf("Invalid choice!!!!\n\n"); 


unsigned GetKmemInt (unsigned offset) 
{ 





off_t seekError; 
ssize_t size; 
unsigned num=0; 


assert ( (offset & 3) == 0); 


seekError = lseek(kmem, offset, SEEK SET); 
assert (seekError != (off t)-1); 








size = read(kmem, &num, sizeof (num) ); 
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assert (sizeof (num) == 4); 
assert (size == 4); 
return num; 


char * GetKmemString (unsigned offset) 
{ 





off t seekError; 
ssize t size; 


buf [80]=0; 
buf [0]=0; 


if (offset == 0) return buf; 





seekError = lseek(kmem, offset, SEEK SET); 
assert(seekError !- (off t)-1); 


size = read(kmem, buf, 80); 
assert (size == 80); 
return buf; 


void GetKmemBlock (unsigned offset, void * buf, unsigned bufSize) 
( 





off_t seekError; 
ssize_t size; 





seekError = lseek(kmem, offset, SEEK SET); 
assert (seekError != (off_t)-1); 


size = read(kmem, buf, bufSize); 


assert (size == bufSize); 


void SetKmemBlock (unsigned offset, void *buf, unsigned bufSize) 
( 





off_t seekError; 
ssize_t size; 





seekError = lseek(kmem, offset, SEEK_SET); 
assert (seekError != (off_t)-1); 


size = write(kmem, buf, bufSize); 


assert (size == bufSize); 


void SetKmemInt (unsigned offset, unsigned x) 
{ 





off t seekError; 
ssize t size; 


ryan joseph @163.net Copyright 2002 杨 立 峰 55 








seekError = lseek(kmem, offset, SEEK_SET); 
assert (seekError != (off_t)-1); 


size = write(kmem, &x, sizeof(x)); 
assert (size == sizeof(x)); 


void Display () 
{ 


unsigned i; 


GetKmemBlock (pData, &data, sizeof (data)); 
printf("$s : Mn", GetKmemString ( (unsigned) data.testName) ) ; 


printf ("breakCount : d\n", data.breakCount); 
printf ("logFlag : Sd\n", data.logFlag) ; 
printf ("panicFlag : d\n", data.panicFlag) ; 
printf ("syncFlag : $dWMn", data.syncFlag) ; 
printf ("range : [Su(Ox%x) : $u(0Ox$x)]WMn", 


data.rangeLow, data.rangeLow, 
data.rangeHigh, data.rangeHigh); 


printf ("numIntrs : Su\n", data.numIntrs); 
printf("numInRangeInts: %u\n", data.numInRangeIntrs); 


printf("skipSti skipCli syncSti syncCli stiBreak restSti restCli\n"); 
printf ("Sd\t%d\tsd\tsd\tsd\tsd\tsd\t\n", 

data.skipSti, 

data.skipCli, 

data.syncStiError, 

data.syncCliError, 

data.stiBreakError, 

data.restoreSti, 

data.restoreCli); 








for (i-0; i< NUM LOG ENTRY; i++) ( 
Emo 9 Segel, ub) 
printf ("NtblockingTime : Su (su us) M", 
data.count [i] .blockingTime, 





data.count [i] .blockingTime / CLOCK FREQUENCY); 
printf ("\tstartFileName ES SN 
GetKmemString ( (unsigned) data.count [i] .startFileName) ) ; 
printf ("\tstartFileLine : Su\n", data.count [i] .startFileline); 
printf ("NtstartCount : Su\n", data.count [i].startCount) ; 
printf ("\tendFileName E- GENAY, 
GetKmemString ( (unsigned) data.count [i] .endFileName) ) ; 
printf ("NtendFileLine : Su\n", data.count [i] .endFileLine) ; 
printf ("\tendCount : $uMn", data.count [i] .endCount) ; 
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Jj 
ee (Walls) 6 


void StartLogging() 
( 


unsigned i; 


RE 
data.breakCount = 0; 
data.logFlag = 0; 
data.panicFlag = 0; 
data.syncFlag = 0; 


data.numIntrs = 0; 
data.numInRangeIntrs 


ll 
o 
~ 


data.skipSti = 
data.skipCli = 
data.syncStiError = 
data.syncCliError = 
data.stiBreakError = 
data.restoreSti = 
data.restoreCli 





0; 


for (i=0; i< NUM_LOG_ENTRY; i++) { 
data.count [i] .blockingTime = 0; 


T 
data.count[i].startFileName = 0; 
data.count[i].startFileLine - 0; 
data.count[i].startCount - 0; 
data.count[i].endFileName - 0; 
data.count[i].endFileLine = 0; 
aL 








data.count .endCount = 0; 


SetKmemBlock (pData, &data, sizeof (data) ); 


/* turn the logging flag */ 
SetKmemInt (pData + ( (unsigned) &édata.logFlag - (unsigned) &data), 1); 





void EndLogging() 


/* turn the logging flag */ 
SetKmemInt (pData + ((unsigned)&data.logFlag - (unsigned)&data), 0); 


void ContinueLoggin () 





/* turn the logging flag */ 
SetKmemInt (pData + ( (unsigned) &édata.logFlag - (unsigned) &data), 1); 
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void SetRange|() 
( 


data.rangeLow = GetInt("Input lower bound (decimal) : "); 


printf("Ntlower bound is %u(0x%x)\n", data.rangeLow, data.rangeLow); 


data.rangeHigh = GetInt ("Input upper bound (decimal) : "); 
printf("Ntupper bound is %u(0x%x)\n", data.rangeHigh, data.rangeHigh); 


SetKmemInt (pData + ((unsigned)&data.rangeLow — 


data.rangeLow); 


SetKmemInt (pData + ((unsigned)&data.rangeHigh - 


data.rangeHigh); 


main () 

{ 
unsigned int cmd; 
unsigned long offset; 


kmem — open("/dev/kmem", O RDWR); 
assert (kmem » 0); 


if (syscall(SYSCALL NUMBER, &pData) !- 0) 





printf("failed to get jsunData address through 


(unsigned) &data) , 


(unsigned) &data) , 


syscall 191!\n"); 


pData = GetHex("Input mannually the address of jsunData : "); 


GetKmemBlock (pData, &data, sizeof (data) ); 


for(;;) { 
cmd = GetCommand () ; 


switch (cmd) { 

case CMD DISPLAY: 
Display (); 
break; 


case CMD START: 
StartLogging(); 
break; 


case CMD STOP: 
EndLogging () ; 
break; 


case CMD CONTINUE: 
ContinueLoggin(); 
break; 
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case CMD_SET_RANGE : 





SetRange () ; 
break; 


case CMD_EXIT: 
close (kmem) ; 
return; 





default: 
assert (0 == 1); 
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附录 B 


上 下 文 切换 测试 程序 lat_ctx.c: 





/* 


* lat ctx.c - context switch timer 


+ 


* 


usage: lat ctx [-s size] #procs [#procs....] 


Copyright (c) 1994 Larry McVoy. Distributed under the FSF GPL with 
additional restriction that results may published only if 

(1) the benchmark is unmodified, and 

(2) the version in the sccsid below is included in the report. 
Support for this development by Sun Microsystems is gratefully 
acknowledged. 

Gë 

chark rdi- asd 


Bro 3% 2 7 pp 


#include "bench.h" 


#if defined(sgi) && defined(PIN) 
#include <sys/sysmp.h> 

#include <sys/syssgi.h> 

int ncpus; 

#endi f 





#define MAXPROC 2048 

#define CHUNK (4<<10) 

#define TRIPS 5 

#ifndef max 

#define max(a, b) Liter Ss (eo) € (al) s (15) 0) 
#endi f 


int process size, *data; /* size & pointer to an array that big */ 
int pids [MAXPROC] ; 

int p[MAXPROC] [2]; 

double pipe cost(int p[][2], int procs); 

int ctx(int procs, int nprocs); 

int sumit (int); 

voidkillem(int procs); 

voiddoit(int p[MAXPROC][2], int rd, int wr); 

int create pipes(int p[][2], int procs); 

int create daemons(int p[][2], int pids[], int procs); 


int 

main(int ac, char **av) 

{ 
int i, max_procs; 
double overhead = 0; 
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if (ac « 2) E 


usage: printf( 
[processes ...]\n", 
av[0]); 
exit (1); 
} 
/* 


"Usage: $s [-s kbytes] processes 


* Need 4 byte ints. 


SCH 


if (sizeof (int) 


I= 201 3 


fprintf(stderr, "Fix sumit() in ctx.c.\n"); 


exit (1); 


/* 


* If they specified a context size, get it. 


A 
if (!strcemp(av[ 
if (ac « 4) 


bg Vos) A 
H 


goto usage; 


) 


process size = atoi(av[2]) * 1024; 
if (process size > 0) { 


data = 
BENCHO 





(int *)calloc(1, max(process size, CHUNK)); 
(sumit (CHUNK), sumit(0), 0); 


overhead - gettime(); 
overhead /= get n(); 
overhead *- process size; 
overhead /= CHUNK; 


#if defined(sgi) && defined (PIN) 
ncpus = sysmp (MP_NPROCS) ; 
sysmp (MP_MUSTRUN, 0); 


#endi f 
for (max_procs 
int procs 
if (max pr 
) 





= atoi(av[l]), = le X < ac; +42) { 
= atoi(av[i]); 
ocs < procs) max_procs = procs; 


max_procs = create_pipes(p, max_procs) ; 
overhead += pipe cost(p, max procs); 
max procs = create daemons (p, pids, max procs); 


fprintf (stderr 
overhead); 
for ir 1013 3 


, "AnN"size-$dk ovr=%.2f\n", process size/1024, 


= acy 4a) 4 


double time; 


int procs 
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if (procs > max_procs) continue; 


BENCH(ctx(procs, max procs), 0); 


( 
time = usecs spent (); 
time /= get n(); 
time /= procs; 
time /= TRIPS; 
time -= overhead; 


fprintf(stderr, "£d %.2f\n", procs, time); 


/* 
* Close the pipes and kill the children. 
Sa 

killem(max procs); 
gone (aL = OS mre tn 

close (p[il [0]); 

close (p[i][1]); 

she (et m ©) 4 
wait (0); 


) 


return (0); 


int 
ctx(int procs, int nprocs) 
( 

int msg; 

mg aLp 

int sum; 


/* 
* Main process - all others should be ready to roll, time the 
?* 160) 312 
SCH 
for (2 = 0r 2 < TRIPs; EXT 
if (write(p[nprocs - procs][1], &msg, sizeof(msg)) != 
sizeof(msg)) { 
perror ("read/write on pipe"); 
exit(1); 
} 


if (read(p[nprocs-1][0], &msg, sizeof(msg)) != sizeof (msg) ) 


perror ("read/write on pipe"); 
exit (1); 
} 


sum = sumit (process_size) ; 
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return (sum); 


void 
killem(int procs) 
( 


aliohe abe 


es (ii = ibe Gb << ooo Harb Í 
sug Jett 3 0) 4 
kill(pids[i], SIGTERM); 





void 
etes (ame pL [Ll]; ades satel, za ve) 
{ 


inte msg, Suma O ASTE 


signal(SIGTERM, SIG DFL); 
if (data) bzero((void*)data, process size); 
mew ( Fe ) ï 


if (read(p[rd][0], &msg, sizeof(msg)) != sizeof(msg)) { 
perror("read/write on pipe"); 
break; 


) 


sum = sumit(process size); 


if (write(p[wr][1], &msg, sizeof(msg)) != sizeof(msg)) { 
perror("read/write on pipe"); 
break; 


} 
use_int (sum) ; 
exit (1); 


int 
doit_cost (int p[][2], int procs) 
{ 

static int k; 

int msg = 1; 

alme IR 


for (x = Us x s IRIPSS FT 


if (write(p[k][1], &msg, sizeof(msg)) != sizeof(msg)) { 
perror("read/write on pipe"); 
exit (1); 

} 

if (read(p[k] [0], &msg, sizeof(msg)) != sizeof(msg)) { 


perror ("read/write on pipe"); 
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exit (1); 

) 

if (ttk — procs) { 
k= Op 


} 


return (msg); 


/* 
* The cost returned is the cost of going through one pipe once in usecs. 
* No memory costs are included here, this is different than lmbenchl. 
Gë 
double 

pipe_cost (int p[][2], int procs) 

( 


double result; 


/* 
* Measure the overhead of passing a byte around the ring. 
A 

BENCH (doit cost(p, procs), 0); 

result = usecs spent (); 

result /= get n(); 

result /= TRIPS; 

return result; 





int 
create daemons(int p[][2], int pids[], int procs) 


( 


alm. IR 

int msg; 

/* 

* Use the pipes as a ring, and fork off a bunch of processes 
* to pass the byte through their part of the ring. 

* 

* 


Do the sum in each process and get that time before moving on. 
7⁄4 
signal (SIGTERM, SIG IGN); 
ors (Gl = dis al < jerome HD) Í 
switch (pids[i] = fork()) { 
case —1: /* could not fork, out of processes? */ 
process que 
break; 


CESS 0< 78 chalice A 
#if defined(sgi) && defined(PIN) 
sysmp (MP_MUSTRUN, i % ncpus); 





#endi f 
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pote (fap sii, Op 
/* NOTREACHED */ 


default: /* parent */ 


, 


/* 
* Go once around the loop to make sure that everyone is ready and 
* to get the token in the pipeline. 


z 
if (write(p[0][1], &msg, sizeof(msg)) != sizeof (msg) || 
read(p[procs-1][0], &msg, sizeof(msg)) != sizeof(msg)) { 
perror("write/read/write on pipe"); 
exit (1); 


} 
if (data) bzero((void*)data, process size); 


return procs; 


int 
create pipes(int p[][2], int procs) 
{ 

og ILR 

/* 

* Get a bunch of pipes. 

Sy 

morefds () ; 

ioe (ak = Oe al < ooesp Hab) af 

sae (eal (ofr) == =I) 4i 
return i; 


} 


return procs; 


/* 
* Bring howmuch data into the cache, assuming that the smallest cache 
* line is 16 bytes. 
7⁄4 
int 
sumit (int howmuch) 
( 
int done, sum = 0; 
register int *d - data; 


#if O 

#define A sum+=d [0]+d[4]+d[8]+d[12]+d[16]+d[20]+d[24]+d[28]+\ 
A[32]+d[36]+d[40]+d[44]+d[48] +d[52]+d[56]+d[60]+\ 
d[64]*d[68]*d[72] kd [76] «d [80] +d[84]+d[88]+d[92]+\ 
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#define TWOKB 


#else 


d[96]*d[100]*d[104]*d [108] *d [112] *d [116] 4d [120] *d [124] 


d+=128; 
AAAA 


#define A 
sumt+=d[0]+d[1]+d[2]+d[3]+d[4]+d[5]+d[6]+d[7 


d 


d 





#define TWOKB 


#endi f 


for (done = 0; done < howmuch; done += 2048) 


) 


10] 


20] 


30] 


40] 


50] 


60] 


70] 


80] 


90] 


*d[21]*d[22] *d [23] *d [24] *d [25] *d 





+d[61]+d[62]+d[63]+d[64]+d[65]+d 
*d[71]*d[72] td [73] *d [74] *d [75] *d 


*d[81]4d4[82] *d [83] *d [84] *d [85] +d 






































+d[91]+d[92]+d[93]+d[94]+d[95]+d 
da[100]+d[ ] ] 
d[105]+d[106]+d[107]+d[108]+d[109 
Olio] tdi tii ta Lei td (Tis isa (4 
ar Msie ira TITE SIES 
E e D AE e 22 ka 2 Se EE 
8; /* ints; bytes == 512 */ 


JA TX IN IN 


d[120 
d+=12 


TWOKB 


return (sum); 


/* bench.h */ 


#ifndef ` BENCH H 


#define 


_BENCH_H 


#ifdef WIN32 
#include <windows.h> 
typedef unsigned char bool_t; 


#endi f 


#include <assert.h> 
#include 
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<ctype.h> 
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*d[11]*d[12]*d[13]*d [14] *d [15] *d[ 


*d[31]*d[32] *d [33] *d [34] *d [35] *d[ 


*d[41]*d[42] *d [43] *d[ 44] *d [45] *d[ 


*d[51]*d[52] *d [53] *d [54] «d [55] *d[ 


101]*d[102]*4d[103] *d [104] 





16 


[26 


36 


46 


56 


66] 


76] 


86] 


96] 


SN 
+\ 
+\ 
EN 


*d[125]*d[126]-*d [127] 





+d 


+d 


+d 


+d 


+d 


+d 


+d 


+d 


*d[ 





] +d 


aal 


2] 


Sy 


47] 


517] 


67] 


Ges 


[87] 


e] 


( 





8]*d[9] *N 


+d 


+d 


+d 


+d 


+d 


+d 


td 


+d 


+d 





18 


28 


38 


48 


58 


68] 


78] 


88] 


98] 





+d 


+d 


+d 


+d 


+d 


*d[ 


*d[ 


*d[ 


*d[ 





19] 


29] 


39] 


49] 


59] 


69] 


79] 


89] 


SE 





AN 


EN 
EN 
EN 
EN 
+\ 
aN 
ZEN 
aN 


ZEN 


eN 
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#include <stdio.h> 
#ifndef WIN32 

#include <unistd.h> 
#endi f 

#include «stdlib.h» 
#include Somme! las 
#include <signal.h> 
#include <errno.h> 
#ifndef WIN32 

#include <strings.h> 
#endi f 

#include <sys/types.h> 
#ifndef WIN32 

#include «sys/mman.h» 
#endi f 

#include <sys/stat.h> 
#ifndef WIN32 

#include <sys/wait.h> 
#include «time.h» 

#include <sys/time.h> 
#include «sys/socket.h» 
#include <sys/un.h> 
#include <sys/resource.h> 
#define PORTMAP 

finclude «rpc/rpc.h» 


#endi f 


#ifndef HAVE uint 
typedef unsigned int uint; 
#endi f 








#ifdef HAVE uint64_t 

typedef uint64_t uint64; 

#else 

typedef unsigned long long uint64; 
#endi f 


#define NO_PORTMAPPER /* needs to be up here, lib_*.h look at 
x, 





#include 
#include 
#include 
#include 
#include 





#ifdef 


vsteal Sm 
"timing.h" 
Wilalley eee 
Wiliam hw 
Wakao) velia oss c To 


DEBUG 


# define debug (x) fprintf x 


#else 


# define debug (x) 


#endi f 
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#ifdef NO_PORTMAPPER 

#define TCP_SELECT E153 

#define TCP XACT -31234 

#define CP CONIROL —31235 

#define TCP DATA -31236 

#define TCP CONNECT -31237 

#define UDP XACT -31238 

#define UDP DATA -31239 

#else 

#define TCP_SELECT (u long) 404038 /* XXX - unregistered */ 
#define TCP_XACT (u long)404039 /* XXX - unregistered */ 
#define TCP CONTROL (u long)404040 /* XXX - unregistered */ 
#define TCP DATA (u long)404041 /* XXX - unregistered */ 
#define TCP CONNECT (u_long) 404042 /* XXX - unregistered */ 









































#define UDP_XACT (u_long) 404032 /* XXX - unregistered */ 
#define UDP_DATA (u_long) 404033 /* XXX - unregistered */ 
#define VERS (u_long) 1 

#endi f 


#define UNIX_CONTROL "/tmp/lmbench.ctl" 
#define UNIX_DATA "/tmp/lmbench.data" 
#define UNIX_LAT "/tmp/lmbench.lat" 








/* 
* socket send/recv buffer optimizations 
SC 

#define SOCKOPT_READ 0x0001 

#define SOCKOPT_WRITE 0x0002 

#define SOCKOPT_RDWR 0x0003 

#define SOCKOPT_PID 0x0004 

#define SOCKOPT_REUSE 0x0008 

#define SOCKOPT_NONE 0 



































#ifndef SOCKBUF 
#define SOCKBUF (1024*1024) 
#endi f 





#ifndef XFERSIZE 
#define XFERSIZE (64*1024) /* all bandwidth I/O should use this */ 
#endi f 

















#if defined(SYS5) || defined(WIN32) 
#define bzero(b, len) memset (b, 0, len) 
#define bcopy(s, d, 1) memcpy (d, s, l) 
#define rindex(s, c) strrchr(s, c) 

# 





endif 

#define gettime usecs_spent 
#define streq !strcmp 
#define ulong unsigned long 


#ifdef USE RAND 
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#define srand48 srand 





#define drand48 () ((double) rand() / (double) RAND_MAX) 
#endi f 

#ifdef USE_RANDOM 

#define srand48 srand 

#define drand48() ((double)rand() / (double)RAND MAX) 
#endi f 


#ifdef WIN32 

#include <process.h> 

#define getpid _getpid 

int gettimeofday(struct timeval *tv, struct timezone *tz); 
#endi f 


#define SMALLEST_LINE 32 /* smallest cache line size */ 
#define TIME OPEN2CLOSE 



































#define GO AWAY signal(SIGALRM, exit); alarm(60 * 60); 

#define REAL SHORT 50000 

#define SHORT 1000000 

#define MEDIUM 2000000 

#define LONGER 7500000 /* for networking data transfers */ 
#define ENOUGH REAL SHORT 

#define TRIES T 





typedef struct ( 

inti N; 

uint64 EERTE SIF 

uint64  n[TRIES]; 
) result t; 
void insertinit(result t *r); 
void insertsort (uint64, uint64, result t *); 
voidsave median(); 
voidsave minimum(); 
voidsave results(result t *r); 
voidget results(result t *r); 











#define BENCHO(loop body, overhead body, enough) { N 
int EN ESSEN: N 
double . oh; N 
result t . overhead, | r; N 
insertinit(& overhead); insertinit(& r); \ 
__N = (enough == 0 | | get_enough (enough) <= 100000) ? TRIES : 
if (enough < LONGER) (loop_body;) /* warm the cache */ \ 
fork ((__ al = Op ab < N; ++ i) { N 
BENCH1 (overhead_body, enough); A 
if (gettime() > 0) \ 
insertsort(gettime(), get n(), & overhead); \ 
BENCH1 (loop body, enough); N 
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if (gettime() > 0) N 





insertsort(gettime(), get n(), & r); N 
) \ 
TM (L 0 MEME ENT dE 20 A N 
_ oh =  overhead.u[ i] / (double)__overhead.n[__i]; 
_ r.u[ i] -= (uint64)((double) r.n[ i] * oh); \ 
} \ 
save results(&  r); N 
} 
#define BENCH(loop_body, enough) { \ 


long i, __ ip \ 
result_t NES \ 
insertinit(& ri? N 


if (enough < LONGER) [loop body;) /* warm the cache */ 














for (__i = 0; i < N; ++ i) { N 
BENCH1 (loop body, enough); N 
if (gettime() > 0) N 
insertsort(gettime(), get n(), & r); N 
} \ 
save_results(&_r); \ 

} 

#define BENCH1(loop_body, enough) { \ 
double . usecs; N 
BENCH_INNER (loop_body, enough); N 
_ usecs = gettime(); \ 

. usecs -= t overhead() + get_n() * 1 overhead(); 
settime(  usecs >= 0. ? (uint64) usecs : 0.); 

} 

#define BENCH_INNER(loop_body, enough) { N 
static u long _ iterations = 1; N 
nime . enough = get enough (enough) ; N 
u long . n; N 
double sue E (028 Y 

N 
while( result < 0.95 * . enough) { N 
start (0); N 
for (__n = iterations; _n> 0;  n--) { \ 
loop_body; À 
} N 
_ result = stop (0,0); N 
if ( result « 0.99 * enough N 
| | T result > 1.2 * __enough) { \ 
LE (C rosiile > 150.) 4 \ 
double tmp = _ iterations / _ result; 
tmp *= 1.1 * | enough; N 


. iterations = (U long) (tmp + 1); \ 


) else { N 
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N = (enough == 0 | | get_enough (enough) <= 100000) ? TRIES : 


um 


N 


N 


N 


dech 
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if (_ iterations > (u_long)1<<27) ( \ 


result 0 N 
break; N 
} \ 
__iterations <<= 3; \ 
} \ 
} N 
} /* while */ N 


save n((uint64) iterations); settime((uint64) result); 


/* 


* Generated from msg.x which is included here: 


program XACT PROG { 
version XACT VERS ( 





char 

RPC XACT(char) = 1; 
j = ip 
} = 99707 


* Please do not edit this file. 
* It was generated using rpcgen. 


Gë 
#include <rpc/types.h> 


#define XACT_PROG ((u long)404040) 
#define XACT VERS ((u_long) 1) 
#define RPC XACT ( (u long)1) 
#define RPC EXIT ((u long)2) 
extern char *rpc xact 1(); 

extern char *client rpc xact 1(); 




















#endif /*  BENCH H */ 
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